写于2015年5月8日,最新修订于2015年5月26日,可能已过时,请谨慎参考。
自古js多奇葩,语言层面上有许多坑,入坑多了也就习惯了。那就再多一个坑吧。
javascript在判断两个值是否相等时,有两种方式==
和===
。这两者的区别我就不多说了,随便一本js书上都有,总之一般情形下我们有这样的结论:==
省事,但结果混乱,很多情形下近乎伪科学,不建议使用,很多人更是视其为洪水猛兽,避之不及(它的坑太多,我写不完,不写了);===
很严谨,在绝大多数情形下,应该使用。这个结论我是很认同的,并且尽量这么做。但是,javascript作为一门任性的语言,不打打脸怎么好玩呢。那么一起来愉快地玩坏===
吧 。
要玩坏===
,只需要用到0。没错,就是数字0。在javascript中,数字都是以浮点数的形式参与运算,其编码规则遵循IEEE_754标准(0.2+0.1不等于0.3这个问题怪它!)。重点也不是这个标准,重点是按照这个标准,数字编码会有一位符号位表示正负,所以对于任何数字,非正即负。那么问题来了,0呢?答案是0也是有正负的。通常我们看到的、定义的0都是+0,但在javascript中-0也是存在的。而在实际运算中,某些场景下,计算结果会产生+0和-0的差异;同样+0和-0参与计算时,可能会导致不同的结果。但在直观感受上,很明显+0和-0应该是相等的才对,于是javascript在语言层面上想消除这种差异,所以:
看起来很合理,虽然有点奇怪。但是再看这样的运算:
这不科学,明明判定为完全相同的值,进行相同的运算后,结果会不相等。对于开发者而言,我们并不能在任何场景下信任
===
,它也有不靠谱的时候。
应对这种“不科学”的情形也很简单:
function isEqual(a, b){
if (a !== b) return false;
return a !== 0 || 1 / a === 1 / b;
}
2015年5月26日补充:
关于IEEE_754标准
这是一个使用二进制表示浮点数的方案,应用很广泛。它规定了一位符号位表示正负,0也不例外,这是负0产生的原因。这是带符号位的浮点数表示方案的通病,当然,不带符号位的方案就可以避免这个问题。不过这个问题并不严重,通常程序语言并不希望开发者知道负0的存在,直接在语言层面上规定正0和负0相等,这才是+0 === -0
的本质原因。
我说负0的问题并不严重,是因为其使用场景少,出bug机率低。说到不严重,肯定有严重的问题,那就是浮点数精度的问题,数值是精确的、连续的;而数值编码是离散的,很多时候不准确的。毕竟32位也好、64位也好,能表现的浮点数是有限的。从0.1、0.2到0.9,真正能精确表达的只有0.5,其他的数字都是近似值。你可以自己尝试一下,不管js、java还是c++,浮点数运算从来不可靠,比如0.2 + 0.1并不等于0.3。如果你有过c++或者java编程经验,很可能接触过一些奇葩的代码来处理浮点数比较,比如定义一个精度0.002f
(假设),如果abs(floatA - floatB) < 0.002f
,则认为两者相等。很反人类,但没办法。编程语言有错吗?没有,但现实就是要妥协。
关于负0
负0在数学上并没有意义,0是无符号的。但如果一个数值趋向于0,那么它是有符号的,可以为负。但对于这种情况,IEEE_754标准并没有定义。所以实际开发场景中,如果一个数值趋向于0,那么它就是0,此时,负0就有意义了,它可能代表的是趋向于0的负数。本质上这还是IEEE_754精度,或者表达范围的问题。但当负0有了具体意义的时候,再说+0 === -0
,我觉得有待商榷的。
负0常见吗
首先我要说负0不常见,但绝不是大家想的通常不可能出现。其实一些常见的、简单的场景下就有可能出现-0。比如Math.ceil(-0.1)
、Math.round(-0.1)
;还有不常见Math.atan2(-1, Infinity)
等。由正负0而产生不同计算结果的操作相对会更多一点,比如文章中的举例的倒数运算。
参考资料:
javascript与===运算
通常情况下,===在js中,表示判断类型和值是否都完全相等。都说通常了,肯定有反例。很多熟悉js的人都知道这样一个知识点,NaN!==NaN
。所以我们常常可以看到这样的代码:
function isNaN (num) {
return num !== num;
}
这就是编程语言为了满足直观的理解而操纵运算符的结果。+0和-0同样是这样,它们的编码并不同,但却判定它们相等。
对于以上两个点,EmacScript 6中加入了Object.is方法来处理:
Object.defineProperty(Object, 'is', {
value: function(x, y) {
if (x === y) {
// 0 === -0, but they are not identical
return x !== 0 || 1 / x === 1 / y;
}
// NaN !== NaN, but they are identical.
// NaNs are the only non-reflexive value, i.e., if x !== x,
// then x is a NaN.
// isNaN is broken: it converts its argument to number, so
// isNaN("foo") => true
return x !== x && y !== y;
},
configurable: true,
enumerable: false,
writable: true
});
参考资料:
- http://wiki.ecmascript.org/doku.php?id=harmony:egal
- https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Object/is
对于负0的问题,EmacScript 5中同样加入了isNegative0来处理-0。
参考资料:
不仅如此,一些工具类库中也加入了类似的处理,如underscore的isEqual方法。
So…
对于绝大部分开发场景而言,-0根本没有存在感;但我把这个点分享出来,让更多的人知道有-0这个东西,让更多的人知道可能存在看似相同的输入,经过相同的计算,产生完全不同结果的可能,避免他们遭遇奇怪的bug。