先看一个初学python阶段最常遇到且最易混用问题:对NONE判断语句的使用:
list_a = []
list_a == NONE
list_a is NONE
# 这里的确都能正确输出
# 但规范的使用应该用 is NONE
按照python的推荐,这里我们当然是应该用 is NONE 来判断。可是我们会思考,这是为什么呢?is 和==又有什么不同?
is 和 ==都是对对象进行比较判断用的,但对对象比较判断的内容并不相同。
is 是同一性运算符,比较对象的唯一身份标识:内存地址,不需调用额外方法,效率更高。
==这种写法其实是语法糖,实际是调用方法.__equal__()比较对象的value值。
我们应该抛弃初学python时接受到的一个说法:"把变量当做一个盒子,我们的对象是存放在盒子中的",这其实是不准确的。
我们可以把变量想成一个个标签,它们只是贴在对象上的一个标记而已。
下面先看一组非常简单的代码:
a = [1, 2, 3]
b = a
a.append(4)
print(b)
#输出:
[1,2,3,4]
我们只对a列表做了添加元素的操作,为什么b也变了呢?如果把变量看成箱子,那a, b都应该是一个单独的箱子,上述这种a、b同时被改变的现象就无法解释了。
我们变量只是内存地址的引用:
这里的原数据为列表[1, 2, 3] 而a 和 b 只是同时贴在了这个数据上的标记,它既叫a也叫b,我们称b是对象的别名,两者都指向的同一个对象。 因此通过a标签对可变对象进行更改后,对象本身就改变了。因此当用b标签来指向对象时,看到的也是对象改变后的结果。当然,再次强调,这只对可变对象管用。
讲了这些看似无关的东西,是因为理解is和 ==需要先纠正之前对变量错误的理解。
继续接最开始的主题强调:
is 是判断内存地址是否相同;
==只判断value值是否相同;
a = [1, 2, 3]
b = a
c = [1, 2, 3, 4]
a.append(4)
# 判断及输出:
a is b
TRUE
a==c and b==c
True
a is c
False
a和b完全是指向同一个对象,他们的内存地址相同。而a和c的值用==判断是相等的,但a is not c,因为它们虽然值相等,但内存地址不同,实际上是两个独立的数据。
我们可以用id()显示内存地址的方法来确认:
a = [1, 2, 3]
b = a
c = [1, 2, 3, 4]
a.append(4)
print(id(a))
548295125904
print(id(b)
548295125904
print(id(c)
548295126352
可以看到,a 和 b的内存地址是相同的,而c的不同。
除了列表数据之外,这里必须提到不同数据类型的内存地址判断的差别:
a = 1 #a、b为数值类型
b = 1
a is b
# 输出:
True
a = "ceshi" #a、b为字符串类型
b = "ceshi"
a is b
# 输出:
True
a = (1,2,3) #a,b为元组类型
b = (1,2,3)
a is b
# 输出:
False
a = [1,2,3] #a、b为列表类型
b = [1,2,3]
a is b
# 输出:
False
#a、b为字典和集合类型时,也都为False 不再重复列举
从上述几个例子可以看出,当分别给相等对象分配不同标签时,只有数值型和字符串类型的 a is b才返回True,其余元组、列表、字典、集合类型a is b都为False。
其中字符串类型其实有许多特殊问题会出现:
a = 'ceshi'
b = 'ceshi'
c = 'ceshiceshi'
d = a+b
c == d
True
c is d
False
a = 'ce shi'
b = 'ce shi'
a is b
False
这里字符串虽是不可变类型 ,但对应的内存地址在特殊情况还是可能会有变化,当字符串中包含特殊字符及空格时,字符串将会使用临时内存地址,使得相同的字符串内存地址也不相同了。此处不做深究,只需记一下如下地址储存的特殊性:
使用固定内存地址存储数据如下:
1. 5到256的整数
2. True和False
3. 由字母、数字、下滑线组成的字符串
使用临时内存地址存储数据如下:
1. 小于-5后大于256的整数
2. 所有小数
3. 包含字母、数字、下滑线之外的字符组成的字符串