认识简单字符串
Python 中的字符串有几种表达方式,可以使用单引号、双引号或三引号(三个单引号或三个双引号)括起来。例如:
>>> 'abc'
'abc'
>>> "abc"
'abc'
>>> '''a\
... b\
... c''' # 使用反斜线(\)来续行
'abc'
>>> '''abc'''
'abc'
如果想要字符串中含有单引号、双引号该怎么处理?有两种方法:一是使用反斜杠转义引号;二是使用与字符串中单引号、双引号不同的引号来定义字符串。例如:
>>> a='a\'b\'c'
>>> print(a)
a'b'c
>>> b="a'b'c"
>>> print(b)
a'b'c
使用\n
换行或使用三引号。例如:
>>> s = 'First line.\nSecond line.' # \n 意味着新行
>>> print(s)
First line.
Second line.
>>> s = '''First line.
... Second line''' # 字符串可以被“”“(三个双引号)或者 '''(三个单引号)括起来,使用三引号时,换行符不需要转义,它们会包含在字符串中
>>> print(s)
First line.
Second line
如果需要避免转义,则可以使用原始字符串,即在字符串的前面加上r。例如:
>>> s = r"Get a practical look at how Kubernetes and container technology \n\
... can help you achieve new levels of velocity, agility, reliability, and efficiency. "
>>> print(s)
Get a practical look at how Kubernetes and container technology \n\
can help you achieve new levels of velocity, agility, reliability, and efficiency.
2.字符串索引
字符串可以被索引,就像C语言中的数组一样,字符串的第一个字符的索引为0,一个字符就是长度为一的字符串。子字符串可以使用分切符来指定:用冒号分隔的两个索引,第一个索引默认为0,第二个索引默认为最后一个位置,s[:]表示整个字符串,s[2:3]表示从第3个字符开始,到第4个字符结束,不包含第4个字符。不同于C字符串的是,Python字符串不能被改变。向一个索引位置赋值会导致错误,例如:
>>> s = "abcdefg"
>>> s[0]
'a'
>>> s[1]
'b'
>>> s[:] # 表示整个字符串
'abcdefg'
>>> s[2:3]
'c'
>>> s[2:]
'cdefg'
>>> s[-1]
'g'
>>> s[-2]
'f'
>>> s[0]='f'f # 向一个索引位置赋值会导致错误,说明字符串是只读的
File "<stdin>", line 1
s[0]='f'f
^
SyntaxError: invalid syntax
3. 字符串的遍历
遍历字符串有三种方式:一是使用enumerate
函数,其返回字符串的索引及相应的字符;二是直接使用for循环;三是通过字符串索引来遍历。例如:
>>> s = "abcdefg"
>>> for i,a in enumerate(s):
... print(i,a)
...
0 a
1 b
2 c
3 d
4 e
5 f
6 g
>>> for a in s:
... print(a)
...
a
b
c
d
e
f
g
>>> for i in range(len(s)):
... print(i,s[i])
...
0 a
1 b
2 c
3 d
4 e
5 f
6 g
4.字符串格式化
Python 支持格式化字符串的输出。最基本用法是将一个值插入到一个有字符串格式符 %s
的字符串中。
>>> print ("我叫 %s 今年 %d 岁!" % ('小明', 10)) # 使用 %
我叫 小明 今年 10 岁!
>>> print ("我叫 {} 今年 {} 岁!".format('小明', 10)) # 使用字符串的 format 方法
我叫 小明 今年 10 岁!
>>> print ("我叫 {0} 今年 {1} 岁!".format('小明', 10, 20)) # 使用索引,整数20未用到
我叫 小明 今年 10 岁!
需要在字符串中使用特殊字符时,Python 用反斜杠()转义字符,如下表所示:
转义字符 | 描述 |
---|---|
%s | 字符串 (采用str()的显示) |
%r | 字符串 (采用repr()的显示) |
%c | 单个字符 |
%b | 二进制整数 |
%d | 十进制整数 |
%i | 十进制整数 |
%o | 八进制整数 |
%x | 十六进制整数 |
%e | 指数 (基底写为e) |
%E | 指数 (基底写为E) |
%f | 浮点数 |
%F | 浮点数,与上相同 |
%g | 指数(e)�或浮点数 (根据显示长度) |
%G | 指数(E)或浮点数 (根据显示长度) |
%% | 字符"%" |
5.字符串的内建函数
Python 字符串的内建函数可以参见下表:
方法 | 描述 |
---|---|
capitalize() | 将字符串的第一个字符转换为大写 |
center(width,fillchar) | 返回一个指定宽度width居中的字符串,fillchar为填充的字符,默认为空格 |
count(str,beg=0,end=len(string)) | 返回str在string中出现的次数,如果beg和end指定,就返回指定范围内str出现的次数 |
decode(encoding='UTF-8',errors='stict') | 使用指定编码解码字符串。默认编码为字符串编码 |
encode(encoding='UTF-8',errors='stict') | 以encoding指定的编码格式编码字符串,如果出错默认抱一个ValueError异常,除非errors指定是ignore或replace |
endwith(stuffix,beg=0,end=len(string)) | 检查字符串是否以obj结束。如果指定beg或end,就检查指定范围内是否以obj结束。如果是就返回True,否则返回False |
expandtabs(tabsize=8) | 把字符串 string 中的 tab 符号转为空格,tab符号默认的空格数是8 |
find(str,beg=0,end=len(string)) | 检测字符串 str 是否包含在字符串中。如果指定beg和end的值,就检查是否包含在指定范围内。如果是,就返回开始的索引值,否则返回-1 |
index(str,beg=0,end=len(string)) | 跟find()方法一样,只不过如果str不在字符串中就会报一个异常 |
isalnum() | 如果字符串非空,且所有字符都是字母或数字,就返回True否则返回False |
isalpha() | 如果字符串非空,且所有字符都是字母,就返回True否则返回False |
isdigit() | 如果字符串只包含数字就返回True否则返回False |
islower() | 如果字符串中包含至少一个区分大小写的字符,并且所有字符都是小写,就返回True,否则返回False |
isnumeric() | 如果字符串只包含数字字符,就返回True,否则返回False |
isspace() | 如果字符串只包含空格,就返回True,否则返回False |
istitle() | 如果字符串是标题化的(详见title()),就返回True,否则返回False |
isupper() | 如果字符串中包含至少一个区分大小写的字符,并且所有字符都是大写,就返回True,否则返回False |
join(seq) | 以指定字符串为分隔符,将seq中的所有元素(字符串表示)合并为一个新字符串 |
len(string) | 返回字符串长度 |
ljust(width[,fillchar]) | 返回左对齐的原字符串,并用fillchar填充至长度 width 的新字符串,fillchar 默认为空格 |
lower() | 转换字符串所有大写字符为小写 |
lstrip() | 截掉字符串左边的空格 |
maketrans() | 创建字符映射的转换表,对于接收两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符;第二个参数也是字符串,表示转换的目标。 |
max(str) | 返回字符串 str 中的最大字母 |
min(str) | 返回字符串 str 中最小的字母 |
repalce(old,new[,max]) | 将原字符串中的str1替换为str2,若max指定,替换就不超过max次 |
rfind(str,beg=0,end=len(string)) | 类似find()函数不过是从右边开始查找 |
rindex(str,beg=0,end=len(string)) | 类似于 index()函数,不过是从右边开始查找 |
rjust(width[,fillchar]) | 返回右对齐的原字符串,并用fillchar填充至长度 width 的新字符串,fillchar 默认为空格 |
rstrip() | 删除字符串末尾的空格 |
split(sep=None, maxsplit=-1) | 以sep为分割符截取字符串,如果maxsplit有指定值,就截取maxsplit个子字符串 |
splitlines([keepends]) | 按照行分割,返回一个包含各行元素的列表。 |
startswith(str,beg=0.end=len(string)) | 检查字符串是否以str开头,返回一个bool值 |
strip([char]) | 在字符串上执行lstrip()和rstrip() |
swapcase() | 将字符串中的大写转换为小写,小写转换为大写 |
title() | 返回“标题化”的字符串,就是所有单词都以大写开始,其余字母均为小写 |
translate(table) | 根据给出的表table转换string的字符 |
upper() | 转换字符串中的小写字幕为大写 |
zfill(width) | 返回长的为width的字符串,原字符串右对齐,前面填充0 |
isdecimal() | 检查字符串是否包含十进制字符,返回一个bool值 |