第5章 - String 字符串

菜鸟教程：https://www.runoob.com/python3/python3-string.html

5.1 基础

字符串是Python中最常用的数据类型。用''，或""来创建字符串。

所有标准的序列操作(如索引、分片、成员资格、求长度、最小值、最大值)对字符串同样适用，但注意字符串是不可变的。所以字符串不能进行分片赋值

str = 'Hello World';
print(str[6:]) # 可以通过分片来获取
str[6:]='Python' # 报错

5.1.1 Python三引号

python三引号允许一个字符串跨多行，字符串中可以包含换行符、制表符以及其他特殊字符，如：

para_str = """这是一个多行字符串的实例
多行字符串可以使用制表符
TAB ( \t )。
也可以使用换行符 [ \n ]。
"""
print (para_str)

5.1.2 Unicode 字符串

在Python2中，普通字符串是以8位ASCII码进行存储的，而Unicode字符串则存储为16位unicode字符串，这样能够表示更多的字符集。使用的语法是在字符串前面加上前缀 u。

在Python3中，所有的字符串都是Unicode字符串。

5.1.3 总结

python中单引号和双引号使用完全相同。
使用三引号('''或""")可以指定一个多行字符串。
转义符 ''
反斜杠可以用来转义，使用r可以让反斜杠不发生转义。。如 r"this is a line with \n" 则\n会显示，并不是换行。
按字面意义级联字符串，如"this " "is " "string"会被自动转换为this is string。
字符串可以用 + 运算符连接在一起，用 * 运算符重复。
Python 中的字符串有两种索引方式，从左往右以 0 开始，从右往左以 -1 开始。
Python中的字符串不能改变。
Python 没有单独的字符类型，一个字符就是长度为 1 的字符串。
字符串的截取的语法格式如下：变量[头下标:尾下标:步长]

代码示例

print('==========[ 字符串 ]==========')
str = 'Hello World'
print(str)                 # 输出字符串
print(str[0:-1])           # 输出第一个到倒数第二个的所有字符
print(str[0])              # 输出字符串第一个字符
print(str[2:5])            # 输出从第三个开始到第五个的字符
print(str[2:5:3])          # 输出从第三个开始到第五个的字符，以3为步长获取
print(str[2:])             # 输出从第三个开始的后的所有字符
print(str * 2)             # 输出字符串两次
print(str + '你好')        # 连接字符串
print('hello\nrunoob')      # 使用反斜杠(\)+n转义特殊字符
print(r'hello\nrunoob')     # 在字符串前面添加一个 r，表示原始字符串，不会发生转义

5.2 转义字符

转义字符	描述	转义字符	描述
\ (在行尾时)	续行符	\n	换行
\\	反斜杠符号	\v	纵向制表符
\'	单引号	\t	横向制表符
\"	双引号	\r	回车
\a	响铃	\f	换页
\b	退格(Backspace)	\oyy	八进制数，yy代表的字符，如\o12代表换行
\c	转义	\xyy	十六进制数，yy代表的字符，如\x0a代表换行
\000	空	\other	其他自负以普通格式输出

5.3 字符串运算符

操作符	描述	实例
+	字符串连接	"Hello" + "Python" => HelloPython
*	重复输出字符串	"Hello" * 2 => HelloHello
[]	通过索引获取字符串中字符	"Hello"[1] => e
[ : ]	截取字符串中的一部分，遵循左闭右开原则，str[0,2] 是不包含第 3 个字符的。	"Hello"[1:4] => ell
in	成员运算符 - 如果字符串中包含给定的字符返回 True	'H' in "Hello" => True
not in	成员运算符 - 如果字符串中不包含给定的字符返回 True	'M' not in "Hello" => True
r/R	原始字符串 - 字符串都是直接按照字面的意思来使用，没有转义特殊或不能打印的字符。原始字符串除在字符串的第一个引号前加上字母 r（可以大小写）以外，与普通字符串有着几乎完全相同的语法。	print( r'\n' ) print( R'\n' )
%	格式字符串

代码示例：

print('\n==========[ 字符串运算符 ]==========')
a = "Hello"
b = "Python"
print("a + b 输出结果：", a + b)
print("a * 2 输出结果：", a * 2)
print("a[1] 输出结果：", a[1])
print("a[1:4] 输出结果：", a[1:4])
# print("a[6:] 报错")

if("H" in a):
    print("H 在变量 a 中")
else:
    print("H 不在变量 a 中")

if("M" not in a):
    print("M 不在变量 a 中")
else:
    print("M 在变量 a 中")

print(r'\n')
print(R'\n')

5.4 字符串格式化

使用操作符百分号(%)实现，%也可以作模运算(求余)操作符。%左边放置待格式化字符串，右边放置希望格式化的值，单个值，不需要加()，多个值则需要用元组()，或字典形式，如：

print('%s'%'Hello')
print('%s,%s'%('Hello','World'))

Python提供的格式化符号

符号	描述	符号	描述
%c	格式化字符及其ASCII码	%f	格式化浮点数字，可指定精度值
%s	格式化字符串	%e / %E	用科学计数法格式化浮点数
%d	格式化整数	%g	%f 和 %e 的简写
%u	格式化无符号整型	%G	%f 和 %E 的简写
%o	格式化无符号八进制数	%p	用十六禁止数格式化变量的地址
%x	格式化无符号十六进制数	%X	格式化无符号十六进制数(大写)

格式化操作符辅助指令:

符号	功能
*	定义宽度或者小数点精度
-	用做左对齐
+	在正数前面显示加号( + )
<sp>	在正数前面显示空格
#	在八进制数前面显示零('0')，在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X')
0	显示的数字前面填充'0'而不是默认的空格
%	'%%'输出一个单一的'%'
(var)	映射变量(字典参数)
m.n	m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话)

如果使用列表或其他序列代替元组，序列就会被解释为一个值。只有元组和字典可以格式化一个以上的值。

说明：

%字符：标记转换说明符开始
转换标志(可选)：- 代表对齐；+ 代表转换值之前要加上正负号；" "(空白字符) 表示正数之前保留空格；0 表示转换值位数不够时用0填充。
最小字段宽度(可选)：转换后的字符串至少应该具有该值指定的宽度。如果是*，宽度就会从元组中读出。%m.nf，m=宽度，n=精度
点(.)后跟精度值(可选)：如果转换的是实数，精度值表示出现在小数点后的位数；如果转换的是字符串，该数字就表示最大字段宽度；如果是*，京都就会从元组中读出
转换类型

示例：

print('\n字段宽度和精度')
print('%10f'%1.2345)   # 宽度10，浮点小数点6位，前面用空格补齐
print('%10.2f'%1.2345) # 宽度10，小数点保留2位，前面用空格补齐
print('%.2f'%1.2345)   # 小数点保留2位，前面用空格补齐
print('%.5s'%'Hello World')   # 打印字符前 5位
print('%*.*f'%(5,2,1.2345)) # *作为占位符，由元组给出值，代表宽度5，小数点2位

print('\n符号、对齐和0填充')
print('%05d'%1)         # 00001; 0填充
print('%010.2f'%1.2345) # 0000001.23
print('%-10.2f'%1.2345) # 1.23      ; -：代表左对齐
print('% 5d'%10)  #    10
print('% 5d'%-10) #   -10
print('% -5d'%10) #  10
print('%+5d'%10)  #   +10
print('%+5d'%-10) #   -10

5.5 字符串内建函数

Python 的字符串常用内建函数如下：

方法	描述
len(string)	返回字符串长度
capitalize()	将字符串的第一个字符转换为大写

| encode(encoding='UTF-8',errors='strict') | 以 encoding 指定的编码格式编码字符串，如果出错默认报一个ValueError 的异常，除非 errors 指定的是'ignore'或者'replace' |
| bytes.decode(encoding="utf-8", errors="strict") | Python3 中没有 decode 方法，但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象，这个 bytes 对象可以由 str.encode() 来编码返回 |

| startswith(substr, beg=0,end=len(string)) | 检查字符串是否是以指定子字符串 substr 开头，是则返回 True，否则返回 False。如果beg 和 end 指定值，则在指定范围内检查 |
| endswith(suffix, beg=0, end=len(string)) | 检查字符串是否以 obj 结束，如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束，如果是，返回 True,否则返回 False |

| split(str="", num=string.count(str)) | num=string.count(str)) 以 str 为分隔符截取字符串，如果 num 有指定值，则仅截取 num+1 个子字符串 |
| splitlines([keepends]) | 按照行('\r', '\r\n', \n')分隔，返回一个包含各行作为元素的列表，如果参数 keepends 为 False，不包含换行符，如果为 True，则保留换行符 |
| join(seq) | 以指定字符串作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
| replace(old, new [, max]) | 把将字符串中的 str1 替换成 str2,如果 max 指定，则替换不超过 max 次 |

| maketrans() | 创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标 |
| translate(table, deletechars="") 根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中 |

实例：

print('\n==========[ 字符串内建函数 ]==========')
print("len('Hello') = ", len('Hello'))  # 5
print("'hello'.capitalize() = ", 'hello'.capitalize())  # Hello

print("'Hello'.encode(encoding='UTF-8') = ", 'Hello'.encode(encoding='UTF-8'))  # b'Hello'
print("'Hello'.encode(encoding='UTF-8').decode(encoding='UTF-8', errors='strict') = ", 'Hello'.encode(encoding='UTF-8').decode(encoding='UTF-8', errors='strict'))  # Hello

print("'Hello'.upper() = ", 'Hello'.upper())  # HELLO
print("'Hello'.lower() = ", 'Hello'.lower())  # hello
print("'Hello'.swapcase() = ", 'Hello'.swapcase())  # hELLO

print("'Hello'.startswith('He') = ", 'Hello'.startswith('He'))  # True
print("'Hello'.endswith('llo') = ", 'Hello'.endswith('llo'))  # True

print("'Hello'.find('llo') = ", 'Hello'.find('l'))  # 2，不存在返回 -1
print("'Hello'.rfind('llo') = ", 'Hello'.rfind('l'))  # 3，不存在返回 -1

print("'Hello'.index('l') = ", 'Hello'.index('l'))  # 2，不存在 抛出异常
print("'Hello'.rindex('l') = ", 'Hello'.rindex('l'))  # 3，不存在 抛出异常

print("'Hello'.count('l') = ", 'Hello'.count('l'))  # 2
print("'He\tllo'.expandtabs(8) = ", 'He\tllo'.expandtabs(8))  # He      llo

print("' Hello '.strip() = ", ' Hello '.strip())  # Hello
print("' Hello '.lstrip() = ", ' Hello '.lstrip())  # Hello
print("' Hello '.rstrip() = ", ' Hello '.rstrip())  #  Hello

print("'Hello'.center(10, '*') = ", 'Hello'.center(10, '*'))  # **Hello***
print("'Hello'.ljust(10, '*') = ", 'Hello'.ljust(10, '*'))  # Hello*****
print("'Hello'.rjust(10, '*') = ", 'Hello'.rjust(10, '*'))  # *****Hello


print("'Hello'.islower() = ", 'Hello'.islower())  # False
print("'HELLO'.isupper() = ", 'HELLO'.isupper())  # True
print("'  '.isspace() = ", '  '.isspace())  # True
print("'12345'.isnumeric() = ", '12345'.isnumeric())  # True
print("'Hello'.isalnum() = ", 'Hello'.isalnum())  # True
print("'Hello'.isalpha() = ", 'Hello'.isalpha())  # True
print("'123'.isdigit() = ", '123'.isdigit())  # True
print("'Hello World'.istitle() = ", 'Hello World'.istitle())  # True
print("u'23443434'.isdecimal() = ", u'23443434'.isdecimal())  # True

print("'Hello World'.split(' ') = ", 'Hello World'.split(' '))  # ['Hello', 'World']
print("'Hello\rrr\nnn\r\nrn'.splitlines() = ", 'Hello\rrr\nnn\r\nrn'.splitlines())  # ['Hello', 'rr', 'nn', 'rn']
print("' '.join(['Hello', 'World']) = ", ' '.join(['Hello', 'World']))  # Hello World
print("'Hello'.replace('llo', 'y') = ", 'Hello'.replace('llo', 'y'))  # Hey

print("max('Hello') = ", max('Hello'))  # o
print("min('Hello') = ", min('Hello'))  # H

print("'Hello'.zfill(8) = ", 'Hello'.zfill(8))  #  000Hello
print("'HELLO WORLD'.title() = ", 'HELLO WORLD'.title())  # Hello World

print("\n maketrans and translate")
intab = "aeiou"
outtab = "12345"
trantab = str.maketrans(intab, outtab)   # 制作翻译表

str = "this is string example....wow!!!"
print (str.translate(trantab))

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,607评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,047评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,496评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,405评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,400评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,479评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,883评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,535评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,743评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,544评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,612评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,309评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,881评论 3赞 306
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,891评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,136评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,783评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,316评论 2赞 342

第5章 - String 字符串

第5章 - String 字符串

5.1 基础

5.1.1 Python三引号

5.1.2 Unicode 字符串

5.1.3 总结

代码示例

5.2 转义字符

5.3 字符串运算符

5.4 字符串格式化

5.5 字符串内建函数

推荐阅读更多精彩内容