Python当中对于拷贝,分为两种类型。一种是数字和字符串,另一种就是列表、元组、字典等其他类型了。
一、数字和字符串的拷贝
1、赋值
举个栗子:
a1 = 123123
a2 = 123123
# a2 = a1 # 赋值
print(id(a1)) # 通过id()函数来打印变量在内存当中的地址
print(id(a2))
输出结果是:
1959780298352
1959780298352
在以上代码块当中,a2与a1所赋的值是一样的,都是数字123123。因为python有一个重用机制,对于同一个数字,python并不会开辟一块新的内存空间,而是维护同一块内存地址,只是将该数字对应的内存地址的引用赋值给变量a1和a2。所以根据输出结果,a1和a2其实对应的是同一块内存地址,只是两个不同的引用罢了。同样的,对于a2 = a1,其实效果等同于“a1 = 123123; a2 = 123123”,它也就是将a1指向123123的引用赋值给a2。字符串跟数字的原理雷同,如果把123123改成“abcabc”也是一样的。*
结论:对于通过用 = 号赋值,数字和字符串 在内存当中用的都是同一块地址。
2、浅拷贝
import copy # 使用浅拷贝需要导入copy模块
a1 = 123123
a3 = copy.copy(a1) # 使用copy模块里的copy()函数就是浅拷贝了
print(id(a1))
print(id(a3))
输出结果是:
35233168
35233168
通过使用copy模块里的copy()函数来进行浅拷贝,把a1拷贝一份赋值给a3,查看输出结果发现,a1和a3的内存地址还是一样。
结论:对于浅拷贝,数字和字符串在内存当中用的也是同一块地址。
3、深拷贝
举个栗子:
import copy
a1 = 123123
a4 = copy.deepcopy(a1) # 深拷贝是用copy模块里的deepcopy()函数
print(id(a1))
print(id(a4))
输出结果为:
31432080
31432080
查看结果发现,对于深拷贝,数字和字符串在内存当中用的也是同一块地址。
所以综上所述,对于数字和字符串的赋值、浅拷贝、深拷贝在内存当中用的都是同一块地址。原理如下图:
二、字典、列表、元组等其他类型的拷贝
1、赋值
举个栗子:
n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]}
n2 = n1 # 赋值
print(id(n1))
print(id(n2))
输出结果:
2235551677536
2235551677536
我们的栗子当中用了一个字典n1,字典里面嵌套了一个列表,当我们把n1赋值给n2时,内存地址并没有发生变化,因为其实它也是只是把n1的引用拿过来赋值给n2而已。(我们用了一个字典来举例,其他类型也是一样的)
原理如下图:
结论:对于赋值,字典、列表、元组等其他类型用的内存地址不会变化。
2、浅拷贝
举个栗子:
import copy
n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]}
n3 = copy.copy(n1) # 浅拷贝
print("第一层字典的内存地址:")
print(id(n1))
print(id(n3))
print("第二层嵌套的列表的内存地址:")
print(id(n1["k3"]))
print(id(n3["k3"]))
输出结果:
第一层字典的内存地址:
6516024
6516096
第二层嵌套的列表的内存地址:
36995720
36995720
通过以上结果可以看出,进行浅拷贝时,我们的字典第一层n1和n3指向的内存地址已经改变了,但是对于第二层里的列表并没有拷贝,它的内存地址还是一样的。原理如下图:
结论:所以对于浅拷贝,字典、列表、元组等类型,它们只拷贝第一层地址
3、深拷贝
举个栗子:
import copy
n1 = {"k1": "wu", "k2": 123, "k3": ["alex", 678]}
n4 = copy.deepcopy(n1) # 深拷贝
print("第一层字典的内存地址:")
print(id(n1))
print(id(n4))
print("第二层嵌套的列表的内存地址:")
print(id(n1["k3"]))
print(id(n4["k3"]))
输出结果:
第一层字典的内存地址:
31157560
35463600
第二层嵌套的列表的内存地址:
35947144
35947336
通过以上结果发现,进行深拷贝时,字典里面的第一层和里面嵌套的地址都已经变了。对于深拷贝,它会拷贝多层,将第二层的列表也拷贝一份,如果还有第三层嵌套,那么第三层的也会拷贝,但是对于里面的最小元素,比如数字和字符串,这里就是“wu”,123,“alex”,678之类的,按照python的机制,它们会共同指向同一个位置,它的内存地址是不会变的。原理如下图:
结论:对于深拷贝,字典、列表、元组等类型,它里面嵌套多少层,就会拷贝多少层出来,但是最底层的数字和字符串地址不变。
举个实际应用场景的栗子。
我们在维护服务器信息的时候,经常会要更新服务器信息,这时我们重新一个一个添加是比较麻烦的,我们可以把原数据类型拷贝一份,在它的基础上做修改。
栗子一、使用浅拷贝
import copy
dic = {
"cpu": [80, ],
"mem": [80, ],
"disk": [80, ]
}
# 定义了一个字典,存储服务器信息。
print('before', dic)
new_dic = copy.copy(dic)
new_dic['cpu'][0] = 50 # 更新cpu为50
print(dic)
print(new_dic)
输出结果为:
before {'cpu': [80], 'mem': [80], 'disk': [80]}
{'cpu': [50], 'mem': [80], 'disk': [80]}
{'cpu': [50], 'mem': [80], 'disk': [80]}
这时我们会发现,使用浅拷贝时,我们修改新的字典的值之后,原来的字典里面的cpu值也被修改了,这并不是我们希望看到的。
栗子二、使用深拷贝
import copy
dic = {
"cpu": [80, ],
"mem": [80, ],
"disk": [80, ]
}
print('before', dic)
new_dic = copy.deepcopy(dic)
new_dic['cpu'][0] = 50
print(dic)
print(new_dic)
输出结果:
before {'cpu': [80], 'mem': [80], 'disk': [80]}
{'cpu': [80], 'mem': [80], 'disk': [80]}
{'cpu': [50], 'mem': [80], 'disk': [80]}
使用深拷贝的时候,发现只有新的字典的cpu值被修改了,原来的字典里面的cpu值没有变。大功告成!
总结
- 赋值(=):数据完全共享(赋值是在内存中指向同一个对象,如果是可变(mutable)类型,比如列表,修改其中一个,另一个必定改变;如果是不可变类型(immutable),比如字符串,修改了其中一个,另一个并不会变)
- 浅拷贝:数据半共享(复制其数据独立内存存放,但是只拷贝成功第一层)
- 深拷贝:数据完全不共享(复制其数据完完全全放独立的一个内存,完全拷贝,数据不共享);深拷贝就是完完全全复制了一份,且数据不会互相影响,因为内存不共享。