一、理解变量在计算机内存中的表式
例如: a = 'ABC'
若为C编译器,则编译器会:
1.在内存里面创建一个'ABC'的字符串(mic);
2.把这个空间的首地址赋值 a。
若为Python编译器则会:
1.在内存里面创建一个'ABC'的字符串;
2.在内存里面创建一个名为 a 的变量,并把他指向字符串。
恩,,,这就是Python里面的指针。
二、Python里面的字符串处理函数
1.获取字符的Unicode值
Python里面的字符串是以Unicode方式存储的。大部分字符的存储空间为两个字节。
ord()函数:
ord('字符(切记是字符。。。不是串)')
当然也有反向变换啦:
chr()函数:
chr(数字)
这里再啰嗦一下Python里面单双引号的问题吧。
在Python里面单引双引号都可以表示字符串。
但是如果你想打印的字符串里面也有单引号的话,就要出现问题啦。
解决这个问题的方法有很多,例如加转义字符。但是用双引号的话,就会默认双引号里面的单引号不作为字符串结束的标志,这样写更简洁明了。
2.字符串的编码与解码
字符串在网络传输过程中是以byte为单位进行传输的,而在计算机内存中是以Unicode方式存储的,每个字符对应N个byte。从网上download一个字符串(比如说网页),如果不加处理就是一大堆byte堆叠而成的无意义字符,必须对其进行解码,才可以转化为我们可以看懂的文字(具体见后续关于爬虫的文章)。使用decoder(),encoder()这两种方法可以解决字符串的编码与解码问题。
具体用法:
'字符串'.encode('期望的编码类型')
'字符串'。decode('原文本的编码类型')
3.计算字符串包含多少字符
len()函数:
len('字符串')
len()默认返回的是字符串里面的字符(注意是字符)的数目,并不一定等于字符串占用计算机内存的字节数。要想返回字符串占用计算机内存的字节数,就要使用到字符串编码与解码的知识啦。
需要注意的是,不同的编码方式会得到不同的字节数哦。
在操作字符串时,我们经常遇到str和bytes的互相转换。为了避免乱码问题,应当始终坚持使用UTF-8编码对str和bytes进行转换。
原网站https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431664106267f12e9bef7ee14cf6a8776a479bdec9b9000
4.格式化输入输出
Python的格式化方法与C语言一致。
三、Python内置数据类型
比较常遇到的Python内置数据类型就是list和tuple啦。这两个和C语言的数组很像(都可以通过len得到内部元素的个数),但是有了高级语言的特性。
先说一下不同:
list内的元素可以改变,而tuple里面的元素(注意限定词,tuple的元素,不是tuple元素的元素)不可以改变。
1.list数据结构内置的方法有:
(1)增加
(2)删除
请见例子
2.声明的方法不一样
声明一个list需要用方括号[ ]把list的元素括起来,而声明一个tuple需要用小括号把元素括起来( )。
list和tuple相同的地方还是蛮多的。。。
1.访问方式
2.嵌套
list里面可以套list,也可以套tuple;tuple也是这样。
list和字符串很像又很不像。主要是字符串是不可变对象,list是可变的。
由于list是可变对象,对list的操作会直接导致list的变化;str是不可变对象,所以任何操作都不会导致字符串本身的变化,而是开辟一个新空间,把结果放进去而已。
四、循环
主要是注意语法,把语句写对。
五、字典
Python内置了字典,通过hash值来实现查找。
用例子说明字典是怎么使用的吧。
上图中逗号之后,冒号之前的值称为key值,是字典索引的唯一位置标号。
注意:
1.字典的声明: { } 和 : 两者缺一不可
2.字典是由hash查找找到的,所以逗号之后,冒号之前的key值是不能改变的。
3.字典查找不会因为字典变大查找时间显著正常。