一·Python是如何进行内存管理
Python是动态类型的语言,对象与引用分离,在Python中,整数和短小的字符,Python都会缓存这些对象,以便重复使用。当我们创建多个等于1的引用时,实际上是让所有这些引用指向同一个对象。链接
关键字:引用计数,垃圾回收,标记清除,内存池分配机制
引用:
>>> a= 10
>>> b=10
>>> print id(a),id(b),id(10)
10414060 10414060 10414060
>>>
>>> import sys
>>> print sys.getrefcount(a),sys.getrefcount(b),sys.getrefcount(10)
160 160 160
>>> c = b
>>> print sys.getrefcount(c)
159
>>> print sys.getrefcount(a)
159
>>> d= c
>>> print sys.getrefcount(d)
160
引用环:
两个对象可能相互引用,从而构成所谓的引用环
即使是一个对象,只需要自己引用自己,也能构成引用环
>>> g = [ ]
>>> g.append(g)
>>> print sys.getrefcount(g)
3
引用减少:通过del 来减少引用 ......
垃圾回收:引用计数为0.
分代回收:存活时间越久的对象,越不可能在后面的程序中变成垃圾,所以减少在垃圾回收中扫描它们的频率。
孤立的引用环:标记-清除
内存池机制:多层封装管理,大内存malloc,小内存pymalloc,python对象(list,整数,浮点数)都有其独立的内存池.
内存池:
- Python 的内存机制呈现金字塔形状,-1,-2 层主要有操作系统进行操作;
- 第 0 层是 C 中的 malloc,free 等内存分配和释放函数进行操作;
- 第 1 层和第 2 层是内存池,有 Python 的接口函数 PyMem_Malloc 函数实现,当对象小于256K 时有该层直接分配内存;
- 第 3 层是最上层,也就是我们对 Python 对象的直接操作;
Python 在运行期间会大量地执行 malloc 和 free 的操作,频繁地在用户态和核心态之间进行切换,这将严重影响 Python 的执行效率。为了加速 Python 的执行效率,Python 引入了一个内存池机制,用于管理对小块内存的申请和释放。Python 内部默认的小块内存与大块内存的分界点定在 256 个字节,当申请的内存小于 256 字节时,PyObject_Malloc 会在内存池中申请内存;当申请的内存大于 256 字节时,PyObject_Malloc 的行为将蜕化为 malloc 的行为。当然,通过修改 Python 源代码,我们可以改变这个默认值,从而改变 Python 的默认内存管理行为。
调优手段(了解)
1.手动垃圾回收
2.调高垃圾回收阈值
3.避免循环引用(手动解循环引用和使用弱引用)
二·Python 引用/赋值,浅拷贝,深拷贝
赋值/引用:创建了对象的一个新的引用,修改其中任意一个变量都会影响到另一个。
浅拷贝:创建一个新的对象,但它包含的是对原始对象中包含项的引用(如果用引用的方式修改其中一个对象,另外一个也会修改改变){1,完全切片方法:a=b[::];2,工厂函数,如list();3,copy模块的copy()函数}
深拷贝:创建一个新的对象,并且递归的复制它所包含的对象(修改其中一个,另外一个不会改变){copy模块的deep.deepcopy()函数}
拷贝操作的警告 :
1、对于非容器类型,如数字,字符,以及其它“原子”类型,没有拷贝一说。产生的都是原对象的引用。
2、如果元组变量值包含原子类型对象,即使采用了深拷贝,也只能得到浅拷贝
三·Python 单引号,双引号,三引号的区别
单引号和双引号是等效的,如果要换行,需要符号(),三引号则可以直接换行,并且可以包含注释。
单引号:s4 = ‘Let\’s go’
双引号:s5 = “Let’s go”
s6 = ‘I realy like“python”!’
四·Python 去重,排序,re模块,lambda,tuple和list的转换
去重:set()
排序:sorted(),list.sort()
re match与search区别
lambda:匿名函数,需要一个函数,但是又不想费神去命名一个函数,a=lambdax,y:x+y
转换:tuple(),list()
四·Python try ... except
try下的语句正常执行,则执行else块代码。如果发生异常,就不会执行。
在except中return后还会执行finally中的代码,如果存在finally语句,最后总是会执行。用 raise 方法可以抛出自定义异常。
except: #捕获所有异常
except: <异常名>: #捕获指定异常
except:<异常名 1, 异常名 2> : 捕获异常 1 或者异常 2
except:<异常名>,<数据>:捕获指定异常及其附加的数据
except:<异常名 1,异常名 2>:<数据>:捕获异常名 1 或者异常名 2,及附加的数据
五·贪婪匹配与非贪婪匹配
String str="abcaxc";
贪婪匹配:最大长度匹配,例如去匹配str:abcaxc(ab*c)。
非贪婪匹配:就是匹配到结果就好,就少的匹配字符。例如:abc(ab*c)。
六·Python的可变与不可变数据类型
可变数据类型:列表list和字典dict;不可变数据类型:整型int、浮点型float、字符串型string和元组tuple。
不可变数据类型,不允许变量的值发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象,内部会有一个引用计数来记录有多少个变量引用这个对象;
可变数据类型,允许变量的值发生变化,即如果对变量进行append、+=等这种操作后,只是改变了变量的值,而不会新建一个对象,变量引用的对象的地址也不会变化,不过对于相同的值的不同对象,在内存中则会存在不同的对象,即每个对象都有自己的地址,相当于内存中对于同值的对象保存了多份,这里不存在引用计数,是实实在在的对象。
操作不可变对象:
>>> a =(2,3)
>>> print a[1]
3
>>> a[1] =3
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'tuple' object does not support item assignment
七·print 调用 Python 中底层的什么方法
print 方法默认调用 sys.stdout.write 方法,即往控制台打印字符串。
八· input()函数
在 Python3 中,input()获取用户输入,不论用户输入的是什么,获取到的都是字符串类型的。
在 Python2 中有 raw_input()和 input():
raw_input()和 Python3 中的 input()作用是一样的,
input()输入的是什么数据类型的,获取到的就是什么数据类型的。
九· range 和 xrange 的区别
两者用法相同,不同的是 range 返回的结果是一个列表,而 xrange 的结果是一个生成器,前者是直接开辟一块内存空间来保存列表,后者是边循环边使用,只有使用时才会开辟内存空间,所以当列表很长时,使用 xrange 性能要比 range 好。
十· read、readline 和 readlines 的区别
read:读取整个文件。
readline:读取下一行,使用生成器方法。
readlines:读取整个文件到一个迭代器以供我们遍历。
十一·init 和new的区别
init 通常用于初始化一个新实例,控制这个初始化的过程,比如添加一些属性, 做一些额外的操作,发生在类实例被创建完以后。它是实例级别的方法。
new 通常用于控制生成一个新实例的过程。它是类级别的方法。
相关链接
十二·模块和包
在 Python 中,模块是搭建程序的一种方式。每一个 Python 代码文件都是一个模块,并可以引用
其他的模块,比如对象和属性。
一个包含许多 Python 代码的文件夹是一个包。一个包可以包含模块和子文件夹。
十三·Python 特性
Python 是强类型的动态脚本语言:
强类型:不允许不同类型相加。
动态:不使用显示数据类型声明,且确定一个变量的类型是在第一次给它赋值的时候。
脚本语言:一般也是解释型语言,运行代码只需要一个解释器,不需要编译。
类型转换:int(‘str’,base=’n’)
>>> int('0x004f',base=16)
79
解释性语言和编译性语言:
解释性语言在运行程序的时候才会进行翻译。
编译型语言写的程序在执行之前,需要一个专门的编译过程,把程序编译成机器语言(可执行文件)
十四·Python 程序运行提升性能
1、使用多进程,充分利用机器的多核性能
2、对于性能影响较大的部分代码,可以使用 C 或 C++编写
3、对于 IO 阻塞造成的性能影响,可以使用 IO 多路复用来解决(同一个线程内同时处理多个IO请求的目的)
4、尽量使用 Python 的内建函数
5、尽量使用局部变量
十五·Python 自省
自带说明的名字叫自省。(反射是 java 的说法,Python叫自省)
自省简单的说,就是用 python 的代码自己告诉这个对象是什么,有什么,以及祖宗是什么,子孙是什么....
python 提供的自省机制:help,dir 。其他的可以用 这两个找到
十六·Python 代码规范(PEP8规范)
- 变量
常量:大写加下划线 USER_CONSTANT
私有变量 : 小写和一个前导下划线 _private_value(Python 中不存在私有变量,这只是程序员之间的一个约定,用于警告说明这是一个私有变量,外部类不要去访问它。但实际上,外部类还是可以访问到这个变量)
内置变量 : 小写,两个前导下划线和两个后置下划线 class(前导下划线会导致变量在解释期间被更名。这是为了避免内置变量和其他变量产生冲突。用户定义的变量要严格避免这种风格)
- 函数和方法
总体:小写和下划线。
私有方法 :小写和一个前导下划线
特殊方法 :小写和两个前导下划线,两个后置下划线
这种风格只应用于特殊函数,比如操作符重载等。
函数参数 : 小写和下划线,缺省值等号两边无空格
类
类总是使用驼峰格式命名,所有单词首字母大写其余字母小写。类名应该简明,精确,并足以从中理解类所完成的工作。常见的一个方法是使用表示其类型或者特性的后缀模块和包
除特殊模块 init 之外,模块名称都使用不带下划线的小写字母。参数
不要用断言来实现静态类型检测。
不要滥用 *args 和 **kwargs。其他
1.使用 has 或 is 前缀命名布尔元素
is_connect = True
2.验证脚本
可以安装一个 pep8 脚本用于验证你的代码风格是否符合 PEP8
1-5:原文链接
6-15:《黑马程序员》