一、列表和元组
1、序列
序列结构主要有列表、元组、集合、字典和字符串
(1)索引:正序从0开始,倒序从-1开始
(2)切片:sname[start:end:step]
(3)相加:sname+sname
(4)乘法:snamen
(5)检查某个元素是否是序列的成员(元素)in
(6)计算序列的长度、最大值和最小值 len、max、min
其他函数:list()、str()、sum()、sorted()、reversed()、enumerate()
2、列表
(1)创建list()、删除del
list(range(10,20,2) #创建10到20之间所有偶数的列表
(2)遍历for
for item in listname:
for index,item in enumerate(listname):
(3)添加+、append、insert、extend、删除del
(4)对列表进行统计计算
1.获取指定元素出现的次数 listname.count(obj)
2.获取指定元素出现的下表listname.index(obj)
3.统计数值列表的元素和sum(iterable[,start])
(5)对列表进行排序
1.使用列表对象的sort()方法实现
listname.sort(key=None,reverse=False)
key=str.lower排序不分大小写
2.使用内置的sorted()函数实现
sorted(iterable,key=None,reverse=False)
(6)列表推导式
1.生成指定范围的数值列表:
list = [Expression for var in range]
例如:randomnumber = [random,randint(10,100) for i in range(10)]
2.根据列表生成指定需求的列表:
newlist = [Expression for var in list]
例如:price = [1200,5330,2988,6200,1998,8888]
sale = [int(x0.5) for x in price]
3.从列表中选择符合条件的元素组成新的列表
newlist = [Expression for var in list if condition]
例如:price = [1200,5330,2988,6200,1998,8888]
sale = [x for x in price if x>5000]
3、元组
num = (1,2,3,4)
(1)创建tuple()
(2)删除del
(3)元组和列表区别:
1.列表属于可变序列,元素可修改或删除;元组为不可变序列,元素不可修改或删除
2.元组比列表的访问和处理速度快,所以如果只需要对其中元素进行访问,而不进行任何修改,建议使用元组
3.列表不能作为字典的健,而元组可以
二、字符串
编码encode()、采用UTF-8编码,汉字占3个字节,采用GBK或GB2312,汉字占2个字节
1、截取字符串
string[start:end:step]
2、分割字符串
string.split(sep,maxsplit)
3、检索字符串
(1)count(),不存在返回0
(2)find()、rfind(),不存在返回-1、存在返回第一次出现的索引
(3)index()、rindex(),不存在抛出异常
(4)startwith()是否指定字符串开头
(5)endwith()是否指定字符串结尾
4、大小写转换
小写:str.lower()
大写:str.upper()
5、去除字符串中的空格和特殊字符
(1)strip()
(2)lstrip()
(3)rstrip()
6、格式化字符串
(1)%
'%[-][+][m][.n]格式化符号'%exp
(2)format
三、正则表达式基础
1、行定位符
^匹配字符串的开始
匹配字符串的结束
3、限定符
?匹配前面的字符零次或一次
+匹配前面的字符一次或多次
*匹配前面的字符零次或多次
{n}匹配前面的字符n次
{n,}匹配前面的字符最少n次
{n,m}匹配前面的字符最小n次,最多m次
4、字符类
[aeiou]匹配任何一个英文元音字母
[.?!]匹配标点符号
[0-9]与\d一样
[a-z0-9A-Z]与\w一样
[\u4e00-\u9fa5]匹配任意一个汉字
[\u4e00-\u9fa5]+匹配多个汉字
5、排除字符
[^a-zA-Z]排除不是字母的字符
6、选择字符
(\d{15}$)|(^\d{18}$)|(\d{17})(\d|X|x)$匹配身份证
7、转义字符
8、分组
()
9、在python中使用正则表达式语法
r''或R''
四、使用re模块实现正则表达式操作
1、匹配字符串
(1)使用match()方法进行匹配
re.match(pattern,string,[flags])
start()、end()、span()、string
(2)使用search()方法进行匹配
re.search(pattern,string,[flags])
(3)使用findall()方法进行匹配
re.findall(pattern,string,[flags])
2、替换字符串
sub()
re.sub(pattern,rep1,string,count,flags)
3、分割字符串
split()
re.split(pattern,string,[maxsplit],[flags])
五、字典
dictionary = {'key1':'value1','key2':'value2'}
特征:
1.通过键而不是通过索引来读取
2.字典是任意对象的无序集合
3.字典是可变的,并且可以任意嵌套
4.字典中的键必须唯一
5.字典中的键必须不可变
1、创建和删除
空字典:dictionary = {}或dictionary = dict()
非空字典:dictionary = dict(zip(list1,list2))或dictionary = dict(key1=value1,key2=value2)
删除 del dictionary
clear()、pop()、popitem()
2、访问
通过dictionary[key]或get(key,[default])
3、遍历
for item in dictionary.items():
4、推导
randomdict = {i:random.ranint(10,100) for i in range(1,5)}
六、集合
1、创建
setname = {element 1 ,element 2}或setname = set(iteration)
2、添加
add()
3、删除
del setname 删除整个集合
setname.pop() 移除第一个
setname.remove('element 1') 移除指定元素,移除前用in先判断是否存在,否则移除报错
setname.clear()清空集合
4、交集&并集|差集-
5、列表[]、元组()、字典{key:value}和集合{}的区别
(1)元组不可变
(2)集合不可重复
(3)列表和元组有序、字典和集合无序