1.什么是字符串
序列,有序,不可变的。
用单引号或者双引号括起来的任意字符集。
2.字符串中的字符
a.普通字符: '23','ashNHJ','-=+!$@% #^&><?', '上的惊世毒妃', '🌲🐶🌺'
b.转义字符:\n, \t, ', ", \
阻止转义:r/R
1.字符编码
python中的字符采用的是Unicode编码
a.什么是编码
就是数字和字符的一一对应的,其中字符对应数字就是字符的编码
a - 97
b - 98
余 - 20313
b.编码方式
ASCII码表:针对数字字符、字母字符、一些英文中常用的符号进行编码
采用一个字节对字符进行编码(128个字符)
Unicode码:Unicode码包含了ASCII码表,同时能够对世界上所有语言对应符号进行编码
采用两个字节对字符进行编码,能编码65536个字符
中文:4E00 ~ 9FA5
c.两个函数
chr(编码值) - 将字符编码转换成字符
ord(字符) - 获取字符对应的编码值
print(chr(0x4E01))
yu = ord('余')
ting = ord('婷')
print(hex(yu), hex(ting))
d.可以将字符编码放到字符串中便是一个字符: \u + 4位的16进制编码值
str1 = 'abc\u4f59123\u1234'
print(str1)
获取字符串中的字符
一旦一个字符串确定,那么字符串中每个字符的位置就确定。
而且每个字符会对应一个用来表示其位置和顺序的下标值。
1.下标(索引)
字符串中的每个字符都有一个下标,代表其在字符串中的位置
下标的范围是: 0 ~ 字符串长度-1 (0代表第一个字符的位置)
-1 ~ -字符串长度 (-1代表最后一个字符的位置)
'abc' # 'a': 0/-3 'b':1/-2 'c':2/-1
'abc\n123' # '1': 4/-3
'abc\u4eff1234' # '1': 4/-3
2.获取单个字符
语法:字符串[下标] - 获取字符串中,指定下标对应的字符
说明: 字符串 - 可以是字符串常量,也可以是字符串变量(只要结果是字符串就行)
[] - 固定写法
下标 - 字符的下标,不能越界
str1 = 'hello python'
print(str1[6], str1[-6])
print(str1[-2])
print(str1[12]) # IndexError: string index out of range
print(str1[-20]) # IndexError: string index out of range
3.获取部分字符
方法1:
a.语法:字符串[开始下标:结束下标:步长]
b.说明:字符串 - 可以是字符串常量,也可以是字符串变量(只要结果是字符串就行)
[] - 固定写法
: - 固定写法
开始下标、结束下标 - 下标值
步长 - 整数
c.功能:
从开始下标开始获取到结束下标前为止, 每次下标值增加步长对应的值。结果是字符串
d.注意:
当步长是正数(从前往后取), 开始下标对应的字符要在结束下标对应的字符的前面
当步长是负数(从后往前取),开始下标对应的字符要在结束下标对应的字符的后面
结束下标对应的值取不到的
str1 = 'abcdefghij'
print(str1[0:6:1])
abcdef
print(str1[0:6:2])
ace
print('==:',str1[-1:6:-1])
print(str1[-1:2:-2])
方法2:
语法:字符串[开始下标:结束下标] (相当于步长是1)
str1 = 'abc123abc'
print(str1[-1:3]) # '' - 空串
print(str1[3:-1])
4.获取部分字符,省略下标
获取部分字符的时候,开始下标和结束下标都可以省略
a.开始下标省略
字符串[:结束下标:步长] 或者 字符串[:结束下标]
步长是正数:从字符串开头开始往后获取
步长是负数:从字符串结尾开始往前获取
str1 = 'abc123abc'
print(str1[:4:1])
print(str1[:4:-1])
b.结束下标省略
字符串[开始下标::步长] 或者 字符串[结束下标:]
步长是正数:从开始下标从前往后获取到字符串结束
步长是负数:从开始下标从前后往前获取到字符串开头
print(str1[4:])
print(str1[4::-1])
print(str1[:])
print(str1[::-1]) # 字符串倒序
print(str1[-100:100]) # 这儿的开始下标和结束下标都可以越界
注:方向判断只看步数正负,正(从左到右),省略步数默认为1
字符串的相关运算
字符串1 + 字符串2: 将两个字符串拼接在一起产生一个新的字符串(不会修改原字符)
注意:字符串相加,加号两边必须都是字符串
str1 = 'abc'
str2 = '123'
print(str1 + str2, str1, str2)
print(str2+10) # TypeError: must be str, not int
print(str2+'10') # 12310
2. *
字符串 * n(正整数):字符串的内容重复n次,产生一个新的字符串
str1 = 'abc'
print(str1*3)
print(''10)
3.比较运算符: >,<. ==, !=, >=, <=
a. ==, !=
字符串1 == 字符串2 - 判断两个字符串是否相等
print('abc' == 'abc')
print('abc' != 'abc')
print('abc' == 'cba')
a. >, <, >=, <=
两个字符串比较大小:从第一个开始,找到第一对不同的字符,然后比较他们的编码值的大小
print('abc' > 'ad') # False
print('abcdZ' > 'abcde' ) # False
print('1abc' < 'ahkks') # True
4. in 和 not in
字符串1 in 字符串2:判断字符串2中是否包含字符串1,结果是布尔
字符串1 not in 字符串2:判断字符串2中是否不包含字符串1,结果是布尔
print('abc' in 'abc123') # True
print('abc' in 'ab123c') # False
print('abc' not in 'ab123c') # True
print('#' in 'ahs#hf#23') # True
5.len函数
len(序列)
len(字符串) - 获取字符串中字符的个数
print(len('abc123'))
print(len('abc\n123\u4edd')) # 8
print(len('abc\n123\u4edd')) # 13
print(len(r'abc\n123\u4edd')) # 14
print(len('abc\t1 23')) # 8
6.str
str(数据);将数据转换成字符串
a.其他数据转换成字符串:
所有的类型的数据都可以转换成字符串。转换的时候就是在数据的值的最外面加引号
补充:系统数据类型名不能用来给变量命名
a.其他数据转换成字符串:
所有的类型的数据都可以转换成字符串。转换的时候就是在数据的值的最外
面加引号
str1 = str(100)
print(str1, type(str1))
b.字符串转其他类型
字符串转整数: int(字符串), 只有去掉引号后剩下的部分本身就是一个整数的字符串才能转换成整型
字符串转浮点型: float(字符串),只有去掉引号后剩下的部分本身就是一个整数或者小数的字符串才能转换成浮点型
字符串转布尔: bool(字符串), 除了空串会转换成False,其他所有的字符串都会转换成True
补充:系统数据类型名不能用来给变量命名
print(int('-123'))
print(float('12.89'), float('123'), float('2e3'))
print(bool('0'), bool('False')) # True
print(bool('')) # False
格式字符串
1.格式字符串
指的是字符串中通过格式占位符来表示字符串中变化,然后后面再通过其他的值来给占位符赋值
语法:
含有格式占位符的字符串 % (占位符对应的值)
说明:格式占位符 - 有固定的写法;可以有多个
% - 固定写法
() - 里面的值的个数和值的类型要和前面的格式占位符一一对应
2.常见格式占位符
%d - 整数
%s - 字符串
%.nf - 小数(保留小数点后n位小数)
%c - 字符 (可以将数字转换成字符)
name = input('名字:')
message = '%s你好,吃饭了吗?' % (name)
print(message)
message = '%s,今年%d岁,体重:%.2fkg 血型是:%c' % (name, 18+2, 65, 97)
print(message)
message = name + ',今年'+ str(18+2)+'岁,体重:'+ str(65)+'kg 血型是:'+chr(97)
print(message)