引入
本文为大家介绍什么是可变类型数据、不可变类型数据并基于这两个知识带大家学习一下python面试中必会被问到的深浅拷贝。
可变类型与不可变类型
首先需要先复习一个知识点---查看变量内存地址,补充一个知识点---容器类型。
复习知识:查看变量的内存地址的方法就是使用id。
补充知识:容器类数据类型是指它能像容器那样存储不同的元素。
知道了这个两个知识后,就来学习什么是可变类型与不可变类型。
a = 1
print(id(a)) # 得到a对应变量值的内存地址
不可变类型
不可变类型是指当一个变量对应的值发生改变之后,这个变量对应的内存地址也会发生改变,证明产生了新的值,而原有的值并未发生改变,只是变量名指向了新的内存地址。
哪些数据类型属于不可变类型?分别是整形int、浮点型float、字符串str、布尔类型,它们被设计成一个不可分割的整体。
比如下面的例子,原理图如下图所示:
>>> a = 10
>>> print(a, id(a))
10 2392239991376
>>> a += 1
>>> print(a, id(a))
11 2392239991408
可变类型
可变类型是指当一个变量对应的值发生改变之后,这个变量对应的内存地址没有发生改变,证明改变的是原值。
哪些数据类型属于可变类型?列表list、字典dict属于可变类型,也是容器类型的。
在研究列表改变值后为什么不会改变内存地址之前,需要知道列表在内存中如何存储数据?比如定义了一个列表l = [1, 2, '小庄']
,它在内存中的存储方式如下图所示:
列表存在内存中时,变量名和列表所在的内存地址的关联关系还是存在栈区,堆区存放的列表中每个元素的内存地址,就相当于一个盒子被分割成几个小格子,每个小格子中存放列表中每个元素的内存地址,就可以通过小格子中的内存地址找到列表中的每个值,因此当我们改变列表中的某个元素时,只是这个盒子中某一个或者某几个小格子中的数据发生变化,盒子并没有改变。
>>> l = [111,222,333]
>>> id(l),id(l[0])
(26891496, 263179920)
>>> l[0] = 555
>>> id(l),id(l[0])
(26891496, 27266160)
字典的key必须是不可变类型,当修改key对应的value时,字典的内存地址不会发生变化,但是key对应的value的内存地址会发生变化。
>>> dic = {"name":"小庄","age":18}
>>> id(dic),id(dic["name"])
(23219408, 27314272)
>>> dic["name"]="张三"
>>> id(dic),id(dic["name"])
(23219408, 27312768)
深浅拷贝
拷贝copy大家都知道,平常在电脑上使用的Ctrl+C
就是拷贝的操作,当然深浅拷贝和直接复制不一样,下面就以可变类型、不可变类型的原理看一下什么浅拷贝什么是深拷贝?
浅拷贝
浅拷贝需要借助copy
方法。
list1 = ['python', 5.21, 123]
list2 = list1.copy() # list2是对list1进行浅拷贝的结果
print(list1, list2) # ['python', 5.21, 123] ['python', 5.21, 123]
print(id(list1), id(list2)) # 1788178477504 1788178503168
通过上面的代码我们可以发现,两个列表的值相同,但是列表的内存地址不相同,现在来看一下两个列表中相同元素的内存地址是否相同?
print(id(list1[0]), id(list2[0])) # 1550675489456 1550675489456
print(id(list1[1]), id(list2[1])) # 1550675569072 1550675569072
print(id(list1[2]), id(list2[2])) # 1550670452912 1550670452912
可以发现,list2
是由list1
通过浅拷贝方法得到的,两个列表中的元素值也相同,而且两个列表中同样的元素所对应的内存地址也是相同的,所以可以得到下方的原理图:
因此,对可变类型的数据类型进行浅拷贝的操作时,会出现以下情况:
# 第一种情况
list1 = [['python', ], 5.21, 123]
list2 = list1.copy()
list2[0][0] = '张三'
print(list1) # [['张三'], 5.21, 123]
print(list2) # [['张三'], 5.21, 123]
# 第二种情况
list1 = [['python', ], 5.21, 123]
list2 = list1.copy()
list2[-1] = 'x'
print(list1) # [['python'], 5.21, 123]
print(list2) # [['python'], 5.21, 'x']
修改的list2
中元素的值,发现list1
中元素的值也发生了变化,这是什么原因? 还是通过图解来看吧.
首先看第一种情况:修改list2
中小列表的元素,列表属于可变类型,修改值只有列表中元素的内存地址发生变法,而小列表的内存地址不会发生变化,list1
和list2
的第一个元素同时指向了被改变元素的小列表的内存地址。
再看第二种情况:修改list2
中的最后一个元素,最后一个元素属于不可变类型,会在内存空间中开辟一块新的内存地址来存储新的值,与list2
绑定,而修改前的值还是原来的内存地址与list1
绑定。
因此浅拷贝是针对只读操作,它是把原列表的第一层内存地址不加区分(可变类型和不可变类型)的完全拷贝给新列表,对于不可变类型的赋值就是产生了新的值,对原列表不产生任何影响。但是对于可变类型,可以改变可变类型中包含的值,于是原列表也会受到影响。不管哪个列表中的可变类型发生变化,都会影响两个列表。
深拷贝
深拷贝需要借助copy
包中的deepcopy
方法。
>>> from copy import deepcopy
>>> list1 = [[256, 257], 258, -10]
>>> list2 = deepcopy(list1)
>>> print(list1)
[[256, 257], 258, -10]
>>> print(list2)
[[256, 257], 258, -10]
>>> id(list1), id(list2) # 列表的内存地址
(1403102546816, 1403102573312)
>>> id(list1[0]), id(list2[0]) # 嵌套的小列表的内存地址
(1403102286272, 1403102573184)
>>> id(list1[0][0]), id(list2[0][0]) # 小列表中元素的内存地址
(1403097016720, 1403097016720)
>>> id(list1[1]), id(list2[1]) # 大列表中其他非可变类型的元素的内存地址
(1403102341904, 1403102341904)
通过上面的代码发现,对list1
进行深拷贝得到的list2
元素值与list1
相同,对于列表中嵌套的小列表内存地址不同,但是小列表中每个元素的内存地址又是相同的,因此对照浅拷贝的原理图,深拷贝的原理如下图所示:
因此深拷贝会不出现修改list2
中可变元素list1
的值也会发生变化的情况。深拷贝对拷贝对象中的元素是否是可变类型进行了区分。
总结:
对于不可变数据类型的变量来说是不存在深浅拷贝的问题。
深浅拷贝讨论的对象是可变数据类型的变量,浅拷贝不会区分容器内的元素是否是可变类型,拷贝后产生的新容器中的元素内存地址还是指向旧容器中元素的内存地址,如果容器中包含可变类型的元素,旧容器中可变类型的元素发生变化时,新容器中该可变类型的元素也会发生变化。
深拷贝的话会区分容器中元素是否是可变类型,对于不可变类型就直接指向原来容器内该元素的内存地址,对于可变类型的元素来说会再拷贝一份内存地址,如果嵌套多层可变类型的元素的话,深拷贝会对每一层的元素都进行判断是否是可变类型,通过这样的操作就可以实现新旧容器的完全独立。
文末
如果你觉得我写的不错,就请给个赞赏吧,欢迎关注我的微信公众号:程序媛小庄,获取更多python知识哦~
更多精彩python教程请来B站关注我哦:python零基础入门---大白话版本来了_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili