通常在Python语言中我们判断两个字符串是否相等的时候,很多同学在初学Python的时候会混用==和is,最后造成的结果就是出错的时候不知道怎么定位,结果也让自己意想不到。
下面我们先来看一下==和is的表现:
为什么会出现这种情况呢?为什么在有些情况下is和==输出结果相同有些情况又不同呢?我们简单做如下分析: 首先通过id()函数来看看这些变量在内存中的具体存储空间,整理情况如下:
从上图表格中我们可以看出来is和==在验证两个字符串是否相等的时候表现是不一致的,显然如果你混用或者误认为他们是等同的那是存在风险的。
那么字符串的比较到底是用is还是==呢,我们来看一下Python官方文档中对两种操作的说明:
从上可知is表示的是标识符(Identity),而==表示的意思是相等(Equality),显然两者不是一个东西。
实际上造成上面输出结果不一致的根本原因在于is的作用在于用来检查对象的标识符是否一致,也就是说is是比较两个对象在内存中是否拥有同一块内存空间,它并不适合来判断两个字符串是否相等。a is b仅当a和b是同一个对象的时候才返回True, 所以a is b基本上相当于id(a) == id(b)。
而==才是真正用来判断两个对象的值是否相等的,它实际调用的是builtins.py中的eq()方法,因此a == b相当于a.eq()b, 所以 == 操作符可以被重载,而 is是不能被重载的。
一般情况下如果a is b为True的话a == b的值也是True,反之则亦然。 特殊情况除外,如下所示:
从上面的介绍弄清楚了is和==的区别之后,我们再来看图示表格中的输出就不难理解了。细心点的同学可能会发现,在表格中a和b的id值一样,也就是说他们在同一内存空间地址中,而a1和b1的id值却不一样,这是为什么呢?这是因为Python中string interning(字符串驻留)机制所决定的: 相对于较小的字符串,Python为了提高性能会保留其值的一个副本,当你再次创建这个字符串的时候,直接就指向了这个副本,所以'hello'这个字符串是在内存中有一个副本的,所以a和b的id的值是一样的;而a1和b1是长字符串,并不会驻留,Python在内存中分别为a1和b1创建了一个内存对象来标识a1和b1,所以这两个对象拥有相同的内容但是标识符是不一样的,所以==的值为True而is的值为False。
所以最后总结一下,在Python里面你要判断两个对象是否相等你应该使用==而不是is。