即时编译
V8采用了即时编译技术(JIT),直接将JavaScript代码编译成本地平台的机器码。这与其他解释器不同,例如Java语言需先将源码编译成字节码,然后给JVM解释执行,JVM根据优化策略,运行过程中有选择的将一部分字节码编译成本地机器码。
V8不生成中间代码,而是,JavaScript源码 -> 抽象语法树 -> 本地机器码。当网页加载完成,V8一步到位,编译成机器码,CPU就开始执行了。比起生成中间码解释执行的方式,V8的策略省去了一个步骤,程序会更早的开始运行。并且执行编译好的机器指令,也比解释执行中间码的速度更快。不足的是,缺少字节码这个中间表示,使得代码优化变得更困难了。
隐藏类
在C++/Java这种静态类型的语言中,每一个变量,都有一个唯一确定的类型。因为有类型信息,一个对象包含哪些成员和这些成员在对象中的偏移量等信息,在编译阶段就可以确定。
运行时,CPU只需要用对象首地址(在C++中是this指针),加上成员在对象内部的偏移量即可访问内部成员,这些访问指令在编译阶段就生成了。
但是对于JavaScript这种动态语言,变量在运行时可以随时由不同类型的对象赋值,并且对象本身可以随时添加删除成员,访问对象属性需要的信息完全由运行时决定。为了实现按照索引的方式访问成员,V8悄悄的给运行中的对象分了类,这个过程中产生的一种V8内部的一个数据结构,称为隐藏类。
隐藏类起到了给对象分组的作用,同一组的对象,具有相同的成员名称。隐藏类记录了成员的名称和偏移量,根据这些信息,V8能够按照“对象首地址+偏移量”来访问成员变量。
假如程序中对某个对象添加或者删除了某个属性,V8立即创建一个新的隐藏类,改变之后的对象指向新创建的隐藏类。
在程序中,访问对象成员是非常频繁的操作,相比于把属性名作为键,然后使用字典查找的方式存取成员来说,使用索引的方式对性能的改进更明显。
内联缓存
成员的索引值是通过哈希表的方式存储在隐藏类中的,使用这个哈希表,我们可以通过属性名获取该成员对应的索引值。但是如果每次访问属性都搜寻隐藏类的哈希表,那么这种获取偏移量的方式会带来性能损失。
内联缓存,是基于程序运行的局部性原理,动态生成用索引查找的代码。下一次存取成员时就不必再去搜寻哈希表了。
优化回退
V8为了进一步提升JavaScript代码的执行效率,使用了Crankshaft编译器生成更搞笑的机器码。在程序运行时,V8会采集JavaScript代码运行数据,当V8发现某函数执行频繁,就将其标记为热点函数。
针对热点函数,V8倾向于认为此函数比较稳定,类型已经确定,于是调用Crankshaft编译器,生成更高效的机器码。后面的运行中,万一遇到类型变化,V8采取将JavaScript函数回退到优化前的较一般的情况。回退过程就是根据函数源码,生成相应的语法树,然后编译成一般形式的机器码。
这个过程是比较耗时的,对于参数类型发生变动的场景,我们最好重新编写一个新的函数。函数的参数类型越确定,V8可进行的优化程度就越高。