从类型说起
js只有7种类型:
- 原始类型(primitives types)
- boolean
- number
- 包括Infinity和NaN,你可以通过
typeof Infinity;
来验证
- 包括Infinity和NaN,你可以通过
- string
- null
- undefined
- Symbol (ECMAScript 6 新定义,暂时用不上,这篇文章不讨论)
- Object 类型
- js内置了很多对象供你使用,MDN文档将它们全部列举了出来(当然,我们经常使用的只是其中的一部分)。
注意,上面这个MDN链接中给出的“值属性”那一栏中的值并不是对象。
原始类型的值是不会改变的。你可以给变量赋予不同的原始值,只不过是让变量指向了内存中的另外一个原始值,但是原本的那个原始值在内存中并没有变化。
Object类型就不一样,通过obj.k = '另一个值'
,在内存中存储obj的一些字节确确实实地被改变了。
有关原始类型和对象类型在变量中是如何存储的,可以看我之前写的一篇文章。
js的自动装箱
虽然string是原始类型,但为什么我们好像可以调用“string的函数”呢?原始类型不应该有函数啊!
var str = 'I am str';
str.toUpperCase(); // "I AM STR"
原因是js标准库给boolean、number、string分别提供了一个包装对象:Boolean
、Number
、String
。在需要的时候,原始类型会自动转换成相应的包装对象(这个过程叫自动装箱)。上例的toUpperCase
就是String标准对象定义的一个函数。
自动装箱就是临时创建一个包装对象,将原始类型的值封装起来,以便调用包装对象的函数。但是原来那个变量的值不会有任何变化!执行完上面例子的代码之后,str指向的依然是那个原始值:
typeof str; // "string"
当然,你可以将Boolean 、Number 、String 这三个函数当作构造函数来使用,通过手动new一个包装类来装箱:
var str_object = new String('I am str_object'); // 手动装箱
str_object.toUpperCase(); // "I AM STR_OBJECT"
typeof str_object; // "object"
在文章的后面,我们还会将这三个函数当作普通的函数使用,实现强制类型转换。
两个与类型转换有关的函数:valueOf()和toString()
- valueOf()的意义是,返回这个对象逻辑上对应的原始类型的值。比如说,String包装对象的valueOf(),应该返回这个对象所包装的字符串。
- toString()的意义是,返回这个对象的字符串表示。用一个字符串来描述这个对象的内容。
valueOf()和toString()是定义在Object.prototype上的方法,也就是说,所有的对象都会继承到这两个方法。但是在Object.prototype上定义的这两个方法往往不能满足我们的需求(Object.prototype.valueOf()仅仅返回对象本身),因此js的许多内置对象都重写了这两个函数,以实现更适合自身的功能需要(比如说,String.prototype.valueOf就覆盖了在Object.prototype中定义的valueOf)。当我们自定义对象的时候,最好也重写这个方法。
以下是部分内置对象调用valueOf()的行为:
对象 | 返回值 |
---|---|
Array | 数组本身(对象类型)。 |
Boolean | 布尔值(原始类型)。 |
Date | 从 UTC 1970 年 1 月 1 日午夜开始计算,到所封装的日期所经过的毫秒数(原始类型)。 |
Function | 函数本身(对象类型)。 |
Number | 数字值(原始类型)。 |
Object | 对象本身(对象类型)。如果自定义对象没有重写valueOf方法,就会使用它。 |
String | 字符串值(原始类型)。 |
由上表可见,valueOf()虽然期望返回原始类型的值,但是实际上有一些对象在逻辑上无法找到与之对应的原始值,因此只能返回对象本身。
toString()则不一样,因为不管什么对象,我们总有办法“描述”它,因此js内置对象的toString()总能返回一个原始string类型的值。
var d = new Date();
d.toString()
// "Fri Apr 21 2017 14:54:04 GMT+0800 (中国标准时间)"
我们自己在重写toString()的时候也应该返回合理的string。
valueOf()和toString()经常会在类型转换的时候被js内部调用,比如说我们后文会谈到的ToPrimitive。在自定义对象上合理地覆盖valueOf()和toString(),可以控制自定义对象的类型转换。
js内部用于实现类型转换的4个函数
这4个方法实际上是ECMAScript定义的4个抽象的操作,它们在js内部使用,进行类型转换。我们js的使用者不能直接调用这些函数,但是了解这些函数有利于我们理解js类型转换的原理。
- ToPrimitive ( input [ , PreferredType ] )
- ToBoolean ( argument )
- ToNumber ( argument )
- ToString ( argument )
请区分这里的ToString()和上文谈到的toString(),一个是js引擎内部使用的函数,另一个是定义在对象上的函数。
ToPrimitive ( input [ , PreferredType ] )
将input转化成一个原始类型的值。PreferredType参数要么不传入,要么是Number 或 String。如果PreferredType参数是Number,ToPrimitive这样执行:
- 如果input本身就是原始类型,直接返回input。
- 调用input.valueOf(),如果结果是原始类型,则返回这个结果。
- 调用input.toString(),如果结果是原始类型,则返回这个结果。
- 抛出TypeError异常。
以下是PreferredType不为Number时的执行顺序。
- 如果PreferredType参数是String,则交换上面这个过程的第2和第3步的顺序,其他执行过程相同。
- 如果PreferredType参数没有传入
- 如果input是内置的Date类型,PreferredType 视为String
- 否则PreferredType 视为 Number
可以看出,ToPrimitive依赖于valueOf和toString的实现。
ToBoolean ( argument )
Argument Type | Result |
---|---|
Undefined | Return false |
Null | Return false |
Boolean | Return argument |
Number | 仅当argument为 +0, -0, or NaN时, return false; 否则一律 return true |
String | 仅当argument是空字符串(长度为0)时, return false; 否则一律 return true |
Symbol | Return true |
Object | Return true |
这些规定都来自ECMA的标准,js内部就是这样实现的。
只需要记忆几种返回false的情况就可以了,其他一律返回true。
ToNumber ( argument )
Argument Type | Result |
---|---|
Undefined | Return NaN |
Null | Return +0 |
Boolean | 如果 argument 为 true, return 1. 如果 argument 为 false, return +0 |
Number | 直接返回argument |
String | 将字符串中的内容转化为数字(比如"23"->23),如果转化失败则返回NaN(比如"23a"->NaN) |
Symbol | 抛出 TypeError 异常 |
Object | 先primValue = ToPrimitive(argument, Number),再对primValue 使用 ToNumber(primValue) |
由上表可见ToNumber的转化并不总是成功,有时会转化成NaN,有时则直接抛出异常。
ToString ( argument )
Argument Type | Result |
---|---|
Undefined | Return "undefined" |
Null | Return "null" |
Boolean | 如果 argument 为 true, return "true".如果 argument 为 false, return "false" |
Number | 用字符串来表示这个数字 |
String | 直接返回 argument |
Symbol | 抛出 TypeError 异常 |
Object | 先primValue = ToPrimitive(argument, hint String),再对primValue使用ToString(primValue) |
隐式类型转换(自动类型转换)
当js期望得到某种类型的值,而实际在那里的值是其他的类型,就会发生隐式类型转换。系统内部会自动调用我们前面说ToBoolean ( argument )、ToNumber ( argument )、ToString ( argument ),尝试转换成期望的数据类型。
例子1:
if ( !undefined
&& !null
&& !0
&& !NaN
&& !''
) {
console.log('true');
} // true
例子1:因为在if的括号中,js期望得到boolean的值,所以对括号中每一个值都使用ToBoolean ( argument ),将它们转化成boolean。
例子2:
3 * { valueOf: function () { return 5 } }; //15
例子2:因为在乘号的两端,js期望得到number类型的值,所以对右边的那个对象使用ToNumber ( argument ),得到结果5,再与乘号左边的3相乘。
例子3:
> function returnObject() { return {} }
> 3 * { valueOf: function () { return {} }, toString: function () { return {} } }
// TypeError: Cannot convert object to primitive value
例子3:调用ToNumber ( argument )的过程中,调用了ToPrimitive ( input , Number ),因为在ToPrimitive中valueOf和toString都没有返回原始类型,所以抛出异常。
符号'+'是一个比较棘手的一个符号,因为它既可以表示“算数加法”,也可以表示“字符串拼接”。
简单理解版本:只要'+'两端的任意一个操作数是字符串,那么这个'+'就表示字符串拼接,否则表示算数加法。
12+3
// 15
12+'3'
// "123"
原理理解版本:根据ECMAScript的定义,对'+'运算的求值按照以下过程:
- 令lval = 符号左边的值,rval = 符号右边的值
- 令lprim = ToPrimitive(lval),rprim = ToPrimitive(rval)
- 如果lprim和rprim中有任意一个为string类型,将ToString(lprim)和ToString(rprim)的结果做字符串拼接
- 否则,将ToNumber(lprim)和ToNumber(rprim)的结果做算数加法
根据这个原理可以解释
[]+[]
// ""
// 提示:ToPrimitive([])返回空字符串
[] + {}
// "[object Object]"
// 提示:ToPrimitive({})返回"[object Object]"
123 + { toString: function () { return "def" } }
// "123def"
// 提示:ToPrimitive(加号右边的对象)返回"def"
{} + []
// 0
// 结果不符合我们的预期:"[object Object]"
// 提示:在Chrome中,符号左边的{}被解释成了一个语句块,而不是一个对象
// 注意在别的执行引擎上可能会将{}解释成对象
// 这一行等价于'+[]'
// '+anyValue'等价于Number(anyValue)
({}) + []
// "[object Object]"
// 加上括号以后,{}被解释成了一个对象,结果符合我们的预期了
'<'、'>'的情况与'+'类似,但是处理方式与'+'有些不同。如果好奇请自行查阅文档。
显式类型转换(强制类型转换)
程序员显式调用Boolean(value)、Number(value)、String(value)完成的类型转换,叫做显示类型转换。
我们在文章的前面说过new Boolean(value)、new Number(value)、new String(value)传入各自对应的原始类型的值,可以实现“装箱”——将原始类型封装成一个对象。其实这三个函数不仅仅可以当作构造函数,它们可以直接当作普通的函数来使用,将任何类型的参数转化成原始类型的值:
Boolean('sdfsd'); // true
Number("23"); // 23
String({a:24}); // "[object Object]"
其实这三个函数用于类型转换的时候,调用的就是js内部的ToBoolean ( argument )、ToNumber ( argument )、ToString ( argument )
方法!
这里解释一下String({a:24}); // "[object Object]"
的过程:
- 执行String({a:24})
- 执行js内部函数ToString ( {a:24} )
- 执行
primValue = ToPrimitive({a:24}, hint String)
- 因为{a:24}不是原始类型,进入下一步。
- 在ToPrimitive内调用({a:24}).toString(),返回了原始值"[object Object]",因此直接返回这个字符串,ToPrimitive后面的步骤不用进行下去了。
- primValue被赋值为ToPrimitive的返回值:"[object Object]"
- 执行js内部函数ToString ( "[object Object]" ),返回"[object Object]"
- 返回"[object Object]"
- 执行
- 返回"[object Object]"
- 执行js内部函数ToString ( {a:24} )
- 返回"[object Object]"
为了防止出现意料之外的结果,最好在不确定的地方使用显式类型转换。
参考文章:
ECMAScript类型转换规范
What is {} + {} in JavaScript?
JavaScript quirk 1: implicit conversion of values
阮一峰的js教程
Object.prototype.toString()的原理
改变Object.prototype.toString.call(myClass)的输出