day4-字符串总结

一.认识字符串

  1. 什么是字符串(str)
    字符串是python中一种常用的有序但是不可变的容器类的数据类型,可以同时存储多个字符。属于序列
    字面量:使用单引号或者双引号甚至是三个单引号(或双引号)将任意字符括起来,就是字符串常量。'sdsd' "sdsds" '''dsds''' """sddsd"""
    字符:指的就是字符串中的每一个单元。注意:python中只有字符概念,没有字符类型。
  2. 字符串中的内容
    a.普通字符:包含数字字符、字母、普通符号:+,-,(),&*@#$等、中文、韩文、日文等
    '123','hsja','3124&#&^%好'
    b.转义字符:通过反斜杠将一些字符转换成有特殊功能或者特殊意义的字符
    \n ——换行(回车键)
    \t——制表符(tab键)
    \'——表示一个单引号
    \"——表示一个双引号
    \\——表示一个\
    注意:一个转义字符代表一个字符
print('abc\n12けち^(* ̄(oo) ̄)^3')#abc
                                  12けち^(* ̄(oo) ̄)^3
print('abc\t123')#abc   123
print('abc\'123')#abc'123
print("abc'123")#abc'123
print('abc\\123')#abc\123

c.阻止转义:在字符串的最前面加r/R,可以阻止转义字符转义

print(r'abc\n123\\3') #abc\n123\\3
print(r'\b') #\b

二.字符编码

python中的字符采用的是Unicode编码

  1. 什么是编码
    编码就是数字和字符是一一对应的,其中字符对应数字就是字符的编码
    'a' - 97
    'b' - 98
    '丁'-19969
  2. 编码方式
ASCII码表:针对数字字符、字母字符、一些英文中常用的符号进行编码
          采用一个字节对字符进行编码,能编码128个字符(2**8)
Unicode码:包含了ASCII码表,同时能够对世界上所有语言对应的符号进行编码
          采用两个字节对字符进行编码,能编码65536个字符(2**16)
          中文:4E00——9FA5
  1. 两个基本函数
    chr(编码值)——将字符编码转换成字符
    ord(字符)——获取字符对应的编码值
print(chr(0x4E01)) # 丁
print(ord('丁'),ord('逸'),ord('飞')) #10进制 19969 36920 39134
ding = ord('丁')
yi = ord('逸')
fei = ord('飞')
print(hex(ding),hex(yi),hex(fei)) #16进制 0x4e01 0x9038 0x98de
  1. 编码字符(\u)
    可以将字符编码放到字符串中便是一个字符:\u+4位的16进制编码值
str1 = 'abc\u4e01\u9038\u98de123'
print(str1) #abc丁逸飞123

三.获取字符串中的字符

一旦一个字符串确定,那么字符串中每个字符的位置就确定。
而且每个字符会对应一个用来表示其位置和顺序的下标值。

  1. 下标(索引)
    字符串中的每个字符都有一个下标,代表其在字符串中的位置
    下标的范围是: 0 ~ 字符串长度-1 (0代表第一个字符的位置)
    -1 ~ -字符串长度 (-1代表最后一个字符的位置)
'abc'   # 'a': 0/-3   'b':1/-2  'c':2/-1
'abc\n123'  # '1': 4/-3
'abc\u4eff123' # '1': 4/-3
  1. 获取单个字符
    语法:字符串[下标]——获取字符串中,指定下标对应的字符
    说明:字符串——可以是字符串常量,也可以是字符串变量(只要结果是字符串就行)
    []——固定写法
    下标——字符的下标,不能越界
print('abcdfe'[2]) #c
str1 = 'hello python'
print(str1[6],str1[-6]) #p p
#print(str1[15]) #IndexError: string index out of range
  1. 获取部分字符
    方法1:
    a.语法:字符串[开始下标:结束下标:步长]
    b.说明:字符串——可以使字符串常量,也可以是字符串变量(只要结果是字符串就行)
    []——固定写法
    :——固定写法
    开始下标、结束下标——下标值
    步长——整数
    c.功能:
    从开始下标开始获取到结束下标前为止。每次下标值增加步长对应的值。结果是字符串
    d.注意:
    当步长是正数(从前往后取),开始下标对应的字符要在结束下标对应的字符的前面
    当步长是负数(从后往前取),开始下标对应的字符要在结束下标对应的字符的后面
    结束下标对应的值取不到
str1 = '0123456789'
print(str1[0:6:1]) #012345
print(str1[-6:8:1])#4567
print(str1[-1:6:-1])#987
print(str1[6:1:-1])#65432
str1 = 'woshinibaba'
print(str1[5:9:1])#niba
str1 = 'woshinibaba'
print(str1[5:9:2])#nb

方法2:
语法:字符串[开始下标:结束下标] (相当于步长是1)

str1 = 'abc123abc'
print(str1[-1:3]) #''——空串
print(str1[3:-1]) #123ab
  1. 获取部分字符,省略下标
    获取部分字符的时候,开始下标和结束下标都可以省略
    a.开始下标省略
    字符串[:结束下标:步长] 或者 字符串[:结束下标]
    步长是正数:从字符串开头开始往后获取
    步长是负数:从字符串结尾开始往前获取
str1 = 'abc123abc'
print(str1[:4]) #abc1
print(str1[:4:-1])#cba3

b.结束下标省略
字符串[开始下标::步长] 或者 字符串[开始下标:]
步长是正数:从开始下标从前往后获取到字符串结束
步长是负数:从开始下标从后往前获取到字符串开头

print(str1[4:])#23abc
print(str1[4::-1])#21cba
print(str1[:])#abc123abc
print(str1[::-1]) #字符串倒序 #cba321cba
print(str1[-100:100]) #这儿的开始下标到结束下标都可以越界#abc123abc

四.字符串相关运算

  1. +
    字符串1 + 字符串2:将两个字符串拼接在一起产生一个新的字符串(不会修改原字符)
    注意:字符串相加,加号两边必须都是字符串。
str1 = 'ddf'
str2 = '666'
print(str1 + str2, str1, str2)  # ddf666 ddf 666
# print(str2+10)  # TypeError: must be str, not int
print(str2+'10')  # 66610
  1. · *·
    字符串 * n(正整数):字符串的内容重复n次,产生一个新的字符串。
str1 = 'abc'
print(str1 * 3)  # abcabcabc
# 练习:10个*跟10个%
print('*' * 10 + '%' * 10)  # **********%%%%%%%%%%
  1. 比较运算符:<,>,==,!=,>=,<=
    a.==,!=
    字符串1 == 字符串2 ——判断两个字符串是否相等
print('ddf' == 'dyf') #False
print('ddf' != 'dyf') #True

b.>,<,>=,<=
两个字符串比较大小:从第一个开始,找到第一对不同的字符,然后比较他们的编码值的大小

print('abc' > 'ad')#False
print('abcdE' > 'abcde') #False
#练习:判断一个字符是否是字母
char = input('请输入一个字符:')
print('是否是字母:','a' <=char<= 'z' or 'A' <=char <='Z')
#练习:判断一个字符是否是中文
print('是否是中文:','\u4e00' <= char <= '\u9FA5')
print('是否是中文:',chr(0x4E00) <= char <= chr(0x9FA5))
print('是否是中文:',0x4E00 <= ord(char) <= 0x9FA5)
  1. in 和 not in
    字符串1 in 字符串2:判断字符串2是否包含字符串1,结果是布尔
    字符串1 not in 字符串2:判断字符串2是否不包含字符串1,结果是布尔
print('abc' in 'abc123')#True
print('abc' in 'ab123c')#False
print('abc' not in 'ab123c')#True
char5 = 'jjjiuh'
print('iuh' in char5) #True
  1. len函数
    len(序列)
    len(字符串)——获取字符串中字符的个数
print(len(char5))#6
print(len('abc\n123\u4edd')) #8
print(len('abc\n123\\u4edd')) #13
print(len(r'abc\n123\u4edd')) #14
print(len('abc\t123'))#7
  1. str函数
    str(数据):将数据转换成字符串
    a.其他数据转换成字符串:
    所有类型的数据都可以转换成字符串。转换的时候就是在数据的值的最外面加引号
    补充:系统数据类型名不能用来给变量命名
str1 = str(100)
print(str1, type(str1)) #100 <class 'str'>

b.字符串转其他类型
字符串转整数:int(字符串),只有去掉引号后剩下的部分本身就是一个整数的字符串才能转换成整型

print(int('1234')) #1234
#print(int('1234ssdsadw'))#ValueError: invalid literal for int() with base 10: '1234ssdsadw'

字符串转浮点型:float(字符串),只有去掉引号后剩下的部分本身就是一个整数或者小数的字符串才能转换成浮点型
print(float('2e3')) #2000.0
字符串转布尔:bool(字符串),除了空串会转换成False,其他所有的字符串都会转换成True
print(bool('0'),bool('False'),bool(''))#True True False

五.格式字符串

  1. 什么是格式字符串
    格式字符串指的是字符串中通过格式占位符来表示字符串中变化,然后后面再通过其他的值来给占位符赋值
    语法:
    含有格式占位符的字符串 % (占位符对应的值)
    说明:格式占位符 - 有固定的写法;可以有多个
    % - 固定写法
    () - 里面的值的个数和值的类型要和前面的格式占位符一一对应

2.常见格式占位符
%d - 整数
%s - 字符串
%.nf - 小数(保留小数点后n位小数)
%c - 字符 (可以将数字转换成字符)

name = input('名字:')
message = '%s你好,吃饭了吗?' % (name)
print(message)

message = '%s,今年%d岁,体重:%.2fkg 血型是:%c' % (name, 18+2, 65, 97)
print(message)

message = name + ',今年'+ str(18+2)+'岁,体重:'+ str(65)+'kg 血型是:'+chr(97)
print(message)

六.python的字符串內建函数

  1. 将字符串第一个字符转换成大写
    字符串.capitalize()
str1 = 'hello'
new_str = str1.capitalize()
print(new_str)  # Hello
  1. 字符串对齐
    字符串.center(width,fillchar)——居中对齐
    字符串.ljust(width,fillchar)——左对齐
    字符串.rjust(width,fillchar)——右对齐
    字符串.zfill(width)——字符串右对齐,前面填充0
    width——正整数,表示新的字符串的宽度
    fillchar——字符,用来填充字符串
str1 = '123'
new_str = str1.center(7, '*')
print(new_str)  # **123**
new_str = str1.ljust(7, '$')
print(new_str)  # 123$$$$
new_str = str1.rjust(7, '@')
print(new_str)  # @@@@123
str2 = 'ddf'
print(str2.zfill(6)) #000ddf

#练习产生一个随机数,并用'python18xxx'格式输出
import random  # 导入随机数对应的模块
#random.randint(m,n)——产生一个m~n的随机整数
num = random.randint(0, 20)
print(num)
new_num = 'python18' + str(num).rjust(3, '0')
print(new_num)
  1. join(seq)
    字符串1.join(字符串2):将字符串1的内容插入到字符串2的每个字符之间
str1 = '**'
str2 = 'abc'
print(str1.join(str2)) #a**b**cc
  1. len(str)——返回字符串长度
  2. max(str)——返回字符串中最大的编码值
    print(max('ad8621964ujahbzck')) #z
  3. min(str)——返回字符串中最小的编码值
    print(min('wosh123103izhennb')) #0
  4. 字符串替换
    字符串.replace(old,new,n)
    将字符串中的old字符串替换成new字符串;如果n指定,则替换次数不超过n次。
str1='ddf_taiqiangle_ddf_nbddfnb_ddf4ddf5ddf'
#str1.replace('ddf','cyy',3)
print(str1.replace('ddf','cyy',3)) #cyy_taiqiangle_cyy_nbcyynb_ddf4ddf5ddf
  1. 删除字符串末尾的空格或指定字符
    字符串.rstrip()
str1 = '   ddf666NBddd'
str2 = 'ddf23   '
print(str1.rstrip('d')) #   ddf666NB
print(str2.rstrip()) #ddf23
  1. 删除字符串左边的空格或指定字符
    字符串.lstrip()
str1 = '   ddf666NBdd   rfd'
str2 = 'ddf23'
print(str1.lstrip()) #ddf666NBdd   rfd
print(str2.lstrip('d')) #f23
  1. 在字符串上执行 lstrip()和 rstrip()
    字符串.strip()
str2 = 'ddf_23   _dd'
print(str2.strip('dd')) #f_23   _
  1. 将字符串中所有小写字母转换为大写字母
    字符串.upper()
str1 = 'ddf666nb'
print(str1.upper()) #DDF666NB
  1. 将字符串中所有大写字母转换为小写字母
    字符串.lower()
str1 = 'ddf666NBdd'
print(str1.lower()) #ddf666nbdd
  1. 将字符串中大写转换为小写,小写转换为大写。
    字符串.swapcase
str1 = 'ddf666ddf_ddf' #DDF666DDF_DDF
print(str1.swapcase())
  1. 返回给定字符串在总字符串里面出现的次数
    字符串.count(str)
str1 = 'ddf666ddf_ddf'
print(str1.count('ddf')) #3
  1. 检查字符串是否只包含十进制字符,如果是返回True,否则返回False。
    字符串.isdecimal()
str1 = 'ddf666'
str2 = '23'
print(str1.isdecimal()) #False
print(str2.isdecimal()) #True
  1. 如果字符串至少有一个字符并且所有字符都是字母或数字则返回True,否则返回False
    字符串.isalnum()
str1 = 'ddf666ddf_ddf'
print(str1.isalnum()) #False
str2 = 'd2df23666ddf'
print(str2.isalnum()) #True
  1. 如果字符串至少有一个字符并且所有字符都是字母则返回True, 否则返回 False
    字符串.isalpha()
str1 = 'ddfDDFdf'
print(str1.isalpha()) #True
str2 = 'd2df23666ddf'
print(str2.isalpha()) #False
  1. 如果字符串只包含数字则返回 True 否则返回 False
    字符串.isdigit()
str2 = '88899243'
print(str2.isdigit()) #True
  1. 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是小写,则返回True,否则返回False
    字符串.islower()
str1 = 'ddfDDFdf'
print(str1.islower()) #False
str2 = 'ddf666'
print(str2.islower()) #True
  1. 如果字符串中只包含数字字符,则返回True,否则返回False(中文数字也可以)
    字符串.isnumeric()
str1 = '88899243一二万百贰亿'
print(str1.isnumeric()) #True
str2 = 'ddf666'
print(str2.isnumeric()) #False
  1. 如果字符串中只包含空白,则返回 True,否则返回 False.
    字符串.isspace()
str1 = ' '
print(str1.isspace()) #True
str2 = 'ddf666'
print(str2.isspace())#False
  1. 返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写
    字符串.title()
str1 = 'DDF666'
print(str1.title())#Ddf666
str2 = 'ddf666DF'
print(str2.title())#Ddf666Df
  1. 如果字符串是标题化的(见 title())则返回 True,否则返回 False
    字符串.istitle()
str1 = 'Ddf666'
print(str1.istitle())#True
str2 = 'ddf666DF'
print(str2.istitle())#False
  1. 如果字符串中包含至少一个区分大小写的字符,并且所有这些(区分大小写的)字符都是大写,则返回 True,否则返回 False
    字符串.isupper()
str1 = 'DDF666'
print(str1.isupper())#True
str2 = 'ddf666DF'
print(str2.isupper())#False
  1. 把字符串中的 tab 符号转为空格,tab 符号默认的空格数是 8 。
    字符串.expandtabs()
  2. 检测 str 是否包含在字符串中,如果指定范围 beg 和 end ,则检查是否包含在指定范围内,如果包含返回开始的索引值,否则返回-1
    字符串.find(str,beg=0,end=len(string))
str1 = 'ddf666dyfDF'
print(str1.find('dyf',0,8))#-1
print(str1.find('dyf',6,10))#6
print(str1.find('dyf'))#6
  1. 类似于 find()函数,不过是从右边开始查找
    字符串.rfind(str,beg=0,end=len(string))
  2. 此方法跟find()方法一样,只不过如果str不在字符串中会报一个异常.
    字符串.index(str,beg=0,end=len(string))
str1 = 'ddf666dyfDF'
print(str1.index('dyf',0,8))#ValueError: substring not found
print(str1.index('dyf',6,10))#6
print(str1.index('dyf'))#6
  1. 类似于 index(),不过是从右边开始查找
    字符串.rindex(str,beg=0,end=len(string))
  2. 以 str 为分隔符截取字符串,如果 num 有指定值,则仅截取 num 个子字符串
    字符串.str1.split(str,num=string.count(str))
str2 = 'ddf666dyfDF666_ddg'
print(str2.split('666',1))#['ddf', 'dyfDF666_ddg']
print(str2.split('666',2))#['ddf', 'dyfDF', '_ddg']
print(str2.split('666'))#['ddf', 'dyfDF', '_ddg']
  1. 按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包留换行符,如果为 True,则保留换行符。
    字符串.str1.splitlines(keepends)
str2 = 'dd\nf666\ndyfDF\r666_d\r\ndg'
print(str2.splitlines())#['dd', 'f666', 'dyfDF', '666_d', 'dg']
print(str2.splitlines(2))#['dd\n', 'f666\n', 'dyfDF\r', '666_d\r\n', 'dg']
print(str2.splitlines(0))#['dd', 'f666', 'dyfDF', '666_d', 'dg']
  1. 检查字符串是否是以 obj 开头,是则返回 True,否则返回 False。如果beg 和 end 指定值,则在指定范围内检查。
    字符串.startswith(str, beg=0,end=len(string))
str2 = 'ddf666dyfDF666_ddg'
print(str2.startswith('dyf'))#False
  1. 检查字符串是否以 obj 结束,如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束,如果是,返回 True,否则返回 False.
    字符串.endswith(str, beg=0,end=len(string))
str2 = 'ddf666dyfDF666_ddg'
print(str2.endswith('dyf'))# False
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,590评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,808评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,151评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,779评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,773评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,656评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,022评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,678评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,038评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,756评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,411评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,005评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,973评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,053评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,495评论 2 343

推荐阅读更多精彩内容