正则表达式、枚举

正则表达式与 JSON

初识正则表达式

正则表达式是一个特殊的字符序列,可以检查一个字符串是否与我们所设定的字符序列想匹配

可以用来快速检索文本和替换文本

比如,检查一串数字是不是电话号码,检查一个字符串是不是 email,把一个文本中指定的单词替换为另外一个单词

一个例子:一个字符串是否包含另一个字符串

# 检查字符串 a 中是否包含 python
a = 'c|c++|go|python|Javascript'
# 使用 python 自带的 in 来操作
print('python' in a)
# 使用正则表达式来操作
import re
r = re.findall('python', a)
print(r)

结果

True
['python']

一个例子:提取字符串 a 中的所有数字

import re

a = 'c0c++7go8python6Javascript'
r = re.findall('\d', a)
print(r)

结果

['0', '7', '8', '6']

第一个例子中的正则表达式 python 和第二个例子中的正则表达式 \d ,分别称为普通字符和元字符。

字符集

import re

s = 'abc, acc, adc, aec, afc, ahc'
# 找出字符串 s 中,中间是 c 或 f 的单词
r = re.findall('a[cf]c', s)
print(r)

# 找出 中间不是 c 或 f 的单词
r = re.findall('a[^cf]c', s)
print(r)

# 找出 中间是 c 或 d 或 e 或 f 的单词
r = re.findall('a[c-f]c', s)
print(r)

结果

['acc', 'afc']
['abc', 'adc', 'aec', 'ahc']
['acc', 'adc', 'aec', 'afc']

概括字符集

[\d] 数字字符,是 [0-9] 的概括字符集,[\D][\d] 的取反

[\w] 单词字符,是 [A-Za-z0-9_] 的概括字符集,[\W][\w] 的取反,包括 [' ', '\t', '&', '\n', '\r']

[\s] 空白字符,匹配空白字符,包括 ' ', '\t', \n', '\r'[\S] 匹配非空白字符

数量词

匹配字符串中的语言名称

import re

a = 'python 1111php678go'

r = re.findall('[a-z]{2,6}', a)
print(r)

结果

['python', 'php', 'go']

贪婪与非贪婪

默认是贪婪匹配,尽可能多的匹配,比如上面的例子中 [a-z]{2,6} 就会尽可能多的匹配到 6

非贪婪匹配,使用问号 [a-z]{2,6}?

import re

a = 'python 1111php678go'

r = re.findall('[a-z]{2,6}?', a)
print(r)

结果

['py', 'th', 'on', 'ph', 'go']

匹配 0 次 1 次或者无限多次

* 对前面的一个字符,匹配 0 次或 无限多 次

import re

a = 'pytho1python2pythonn3'

r = re.findall('python*', a)
print(r)

结果

['pytho', 'python', 'pythonn']

+ 对前面的一个字符,匹配 1 次或 无限多 次

import re

a = 'pytho1python2pythonn3'

r = re.findall('python+', a)
print(r)

结果

['python', 'pythonn']

? 对前面的一个字符,匹配 0 次或 1 次

import re

a = 'pytho1python2pythonn3'

r = re.findall('python?', a)
print(r)

结果

['pytho', 'python', 'python']

边界匹配符

^ 从字符串的开头开始匹配

$ 从字符串的末尾开始匹配

匹配长度为 4~8 位的字符

import re

qq = '123456789'
r = re.findall('^\d{4,8}$', qq)
print(r)

结果

[]

()

[] 字符集,中的每个字符是或的关系,() 组,中的每个字符是且的关系

3 个 python 匹配 1 次:

import re

a = 'PythonPythonPythonPythonPythonPython'
r = re.findall('(Python){3}', a)
print(r)

结果

['Python', 'Python']

匹配模式参数

小写匹配大写

import re

lanuage = 'PYTHON'

r = re.findall('python', lanuage)
print(r)

结果,匹配不到

[]

忽略大小写

import re

lanuage = 'PYTHON'

r = re.findall('python', lanuage, re.I)
print(r)

结果

['PYTHON']

. 匹配出换行符 \n 之外其他所有字符

. 匹配换行符:

import re

lanuage = 'PYTHON\n'

r = re.findall('python.', lanuage, re.I)
print(r)

结果,匹配不到

[]

匹配换行符:

import re

lanuage = 'PYTHON\n'

r = re.findall('python.', lanuage, re.I | re.S)
print(r)

结果

['PYTHON\n']

re.sub 正则替换

匹配到,替换。

re.sub('要匹配的', '替换为', 字符串)

import re

lanuage = 'PythonC++JavaPHPJava'
r = re.sub('Java', 'GO', lanuage)
print(r)

结果

PythonC++GOPHPGO

只替换匹配到的第一个

import re

lanuage = 'PythonC++JavaPHPJava'
r = re.sub('Java', 'GO', lanuage, 1)
print(r)

结果

PythonC++GOPHPJava

第二个参数,可以是一个函数

import re

lanuage = 'PythonC++GOPHPGO'

def convert(value):
    # value 是匹配到的对象
    print(value)
    matched = value.group()
    # return 是替换为
    return '>' +  matched + '<'

r = re.sub('GO', convert, lanuage)
print(r)

结果

<re.Match object; span=(9, 11), match='GO'>
<re.Match object; span=(14, 16), match='GO'>
PythonC++>GO<PHP>GO<

一个字符串,匹配其中的数字,大于 6 的替换成 9,小于 6 的替换成 0:

import re

s = 'A8C3721D86'

def convert(value):
    matched = value.group()
    if int(matched) >= 6:
        return '9'
    else:
        return '0'

r = re.sub('\d', convert, s)
print(r)

结果

A9C0900D99

Search 与 match 函数

re.match() 从首字符开始匹配,如果首字符不匹配,就返回 None,匹配到就返回匹配到的对象,只匹配一次

re.search() 搜索整个字符串,返回匹配到的第一个对象

group 分组

不要首尾

import re

s = 'life is short, i use python'

r = re.search('life(.*)python', s)
print(r.group(1))

结果

 is short, i use 

findall() 不需要使用 group()

import re

s = 'life is short, i use python'

r = re.findall('life(.*)python', s)
print(r)

结果

[' is short, i use ']

多个分组

import re

s = 'life is short, i use python, i love python'

r = re.search('life(.*)python(.*)python', s)
print(r.group(0))
print(r.group(1))
print(r.group(2))
print(r.groups())

结果

life is short, i use python, i love python
 is short, i use 
, i love 
(' is short, i use ', ', i love ')

理解 JSON

一种轻量级的数据交换格式

  • 易于阅读
  • 易于解析
  • 网络传输效率高
  • 跨语言交换数据

json 有自己的数据类型

Json Python
object dict
array list
string str
number int
number float
true True
false False
null None

反序列化

import json

json_object = '{"name":"张三", "age":18}'

student = json.loads(json_str)
print(type(student))
print(student)
print(student['name'])
print(student['age'])

结果

<class 'dict'>
{'name': '张三', 'age': 18}
张三
18
import json

json_array = '[{"name":"张三","age":18, "flag":false}, {"name":"小明", "age":18, "flag":true}]'

student = json.loads(json_array)
print(type(student))
print(student)

结果

<class 'list'>
[{'name': '张三', 'age': 18, 'flag': False}, {'name': '小明', 'age': 18, 'flag': True}]

序列化

import json

student = [{'name': 'zhangsan', 'age': 18, 'flag': False}, {'name': 'xiaoming', 'age': 19, 'flag': True}]

json_array = json.dumps(student)
print(type(json_array))
print(json_array)

结果

<class 'str'>
[{"name": "zhangsan", "age": 18, "flag": false}, {"name": "xiaoming", "age": 19, "flag": true}]

枚举和闭包

枚举其实是一个类

from enum import Enum

class VIP(Enum):
    YELLOW = 1
    GREEN = 2
    BLACK = 3
    RED = 4

print(VIP.YELLOW)

结果

VIP.YELLOW

枚举和普通类相比的优势

普通类的类变量,可修改,变量名可重复

枚举类的类变量,不可修改,变量名不可重复

修改普通类的类变量

class Common:
    YELLOW = 1

Common.YELLOW = 6
print(Common.YELLOW)

结果

6

修改枚举类的类变量

from enum import Enum

class VIP(Enum):
    YELLOW = 1
    GREEN = 2
    BLACK = 3
    RED = 4

VIP.YELLOW = 6

结果

AttributeError: Cannot reassign members.

普通类的变量名可以重复

class Common:
    YELLOW = 1
    YELLOW = 1

print(Common.YELLOW)

结果

1

枚举类的变量名不可重复

from enum import Enum

class VIP(Enum):
    YELLOW = 1
    YELLOW = 2
    BLACK = 3
    RED = 4

print(VIP.YELLOW)

结果

TypeError: Attempted to reuse key: 'YELLOW'

枚举类型、枚举名称与枚举值

获取 枚举值 和 枚举名称

from enum import Enum

class VIP(Enum):
    YELLOW = 1
    GREEN = 2
    BLACK = 3
    RED = 4

print(VIP.YELLOW.value)
print(VIP.YELLOW.name)

结果

1
YELLOW

枚举名称和枚举类型不同

from enum import Enum

class VIP(Enum):
    YELLOW = 1
    GREEN = 2
    BLACK = 3
    RED = 4

# 枚举名称
print(VIP.YELLOW.name)
# 枚举类型
print(VIP.YELLOW)

print(type(VIP.YELLOW.name))
print(type(VIP.YELLOW))

# 通过枚举名称获取枚举类型
print(VIP['YELLOW'])

结果

YELLOW
VIP.YELLOW
<class 'str'>
<enum 'VIP'>
VIP.YELLOW

枚举可以遍历

通过遍历枚举,获取到这个枚举下面的所有枚举类型

from enum import Enum

class VIP(Enum):
    YELLOW = 1
    GREEN = 2
    BLACK = 3
    RED = 4
    
for v in VIP:
    print(v)

结果

VIP.YELLOW
VIP.GREEN
VIP.BLACK
VIP.RED

枚举的比较运算

枚举的注意事项

枚举类型的值可以重复,不过此时后一个可以看做是前一个的别名

from enum import Enum

class VIP(Enum):
    YELLOW = 1
    GREEN = 1
    BLACK = 3
    RED = 4

print(VIP.GREEN)

结果

VIP.YELLOW

在遍历的时候,别名不会遍历出来

...
for v in VIP:
    print(v)

结果

VIP.YELLOW
VIP.BLACK
VIP.RED

如果需要遍历出来:

...
for v in VIP.__members__.items():
    print(v)

结果

('YELLOW', <VIP.YELLOW: 1>)
('GREEN', <VIP.YELLOW: 1>)
('BLACK', <VIP.BLACK: 3>)
('RED', <VIP.RED: 4>)

也可以不加 items()

...
for v in VIP.__members__:
    print(v)

结果

YELLOW
GREEN
BLACK
RED

通过枚举值获取枚举名

数据库中存枚举值,因为占用空间小,代码中使用枚举名,因为可读性高

通过枚举值获取枚举名

from enum import Enum

class VIP(Enum):
    YELLOW = 1
    GREEN = 1
    BLACK = 3
    RED = 4

a = 1
print(VIP(a))

结果

VIP.YELLOW

枚举小结

Enum 的枚举值可以是字符串,如果只有数值类型的枚举值,可以使用 IntEnum

@unique 可以防止枚举值相同

枚举类不能实例化

一切皆对象

python 中一切皆对象

函数也是对象,可以赋值给变量,可以作为另一个函数的参数,可以作为另一个函数的返回值

函数也是对象:

def a():
    pass

print(type(a))

结果

<class 'function'>

什么是闭包

调用函数 curve

def a():
    def b():
        pass

b()

结果

NameError: name 'b' is not defined

因为函数 curve 的作用域只在函数 curve_pre 内部。

函数可以作为另一个函数的返回值,也可以赋值给变量

def a():
    def b():
        print('This is a function')
    # 函数可以作为另一个函数的返回值
    return b

# 函数可以赋值给变量
f = a()
# f() 相当于 b()
f()

结果

This is a function

传个参数

def a():
    x = 1
    def b(y):
        return x + y
    # 函数可以作为另一个函数的返回值
    return b

# 函数可以赋值给变量
f = a()
# f(2) 相当于 b(2)
result = f(2)
print(result)

结果

3

闭包 = 函数 + 环境变量

在上面的代码中,return b 其实并不只是返回了函数 b ,与函数 b 一起返回的,还有它的环境变量 x = 1 ,它们是一个整体,也就是一个闭包。

获取这个环境变量的值:

...
print(f.__closure__[0].cell_contents)

结果

1

一个示例看看闭包

def f1():
    a = 10
    def f2():
        a = 20
        print(a)
    print(a)
    f2()
    print(a)

f1()

结果

10
20
10

闭包的经典误区

如果函数对它的环境变量重新赋值,那么这个变量会变成一个普通的局部变量

def f1():
    a = 10
    def f2():
        # 对环境变量重新赋值,a 会被 python 认为是一个局部变量
        a = 20
        return a
    return f2

f = f1()
print(f.__closure__)

结果

None

闭包解决问题

计算步数

初始步数 x = 0 ,走 3 步 result = 3,停一停,走 5 步,result = 8,休息一下,走 3 步, result = 11

不使用闭包的实现方法

steps = 0

def go(step):
    global steps
    steps += step
    return steps

result1 = go(3)
print(result1)
result2 = go(5)
print(result2)
result3 = go(3)
print(result3)

结果

3
8
11

使用闭包实现

steps = 0

def factory(steps):
    def go(step):
        # 声明 steps 不是局部变量
        nonlocal steps
        steps += step
        return steps
    return go

# 调用 factory 函数
g = factory(steps)

# 第一次调用 go 函数
result1 = g(3)
# 结果
print(result1)
# 环境变量
print(g.__closure__[0].cell_contents)
# 全局变量
print(steps)

result2 = g(5)
print(result2)
print(g.__closure__[0].cell_contents)
print(steps)

result3 = g(3)
print(result3)
print(g.__closure__[0].cell_contents)
print(steps)


结果

3
3
0
8
8
0
11
11
0

全局变量 steps = 0 始终没有被改变,这是使用闭包的好处,因为如果每个函数都修改全局变量,容易乱。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,905评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,140评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,791评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,483评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,476评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,516评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,905评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,560评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,778评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,557评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,635评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,338评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,925评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,898评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,142评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,818评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,347评论 2 342

推荐阅读更多精彩内容

  • localStorage 永久存储 本地永久存储,就算你关闭了浏览器,数据依然存在,除非你手动清空掉它 local...
    曹昆_09a6阅读 370评论 0 0
  • 类别扩展现有的类 定制现有的类 对象应该具有明确定义的任务,例如为特定信息建模、显示可视内容或控制信息流。...
    彬至睢阳阅读 111评论 0 1
  • 简介 这是一个Swift语言教程,基于最新的iOS 9,Xcode 7.3和Swift 2.2,会为你介绍Swif...
    张嘉夫阅读 3,144评论 0 49
  • 简书第二次 内容全局变量和局部变量switch语句for循环while循环break和continue作用prin...
    三生枕上书_0f49阅读 672评论 0 0
  • 1..sort 排序原理 冒泡排序法解析:冒泡排序法的原理:比较相邻的元素。如果第一个比第二个大,就交换他们两个。...
    耶啵_阅读 173评论 0 1