认识浏览器的内核
- 不同的浏览器又不同的内核组成
- Gecko:早期被Netscape和Mozilla Friefox浏览器使用;
- Trident:微软开发,被IE4~IE11浏览器使用,但是Edge浏览器已经转向Blink;
- Webkit:苹果基于KHTML开发、开源的,用于Safari、Google Chrome之前也在使用;
- Blink:是Webkit的一个分支,Google开发,目前应用于Google Chrome、Edge、Opera等;
- 事实上,我们经常说的浏览器内核指的是浏览器的排版引擎:
- 排版引擎(layout engine),也称为浏览器引擎(browser engine)、页面渲染引擎(rendering engine)或模板引擎。
浏览器的工作原理
- JavaScript代码,在浏览器中是如何被执行的?
浏览器渲染过程
-
但是在这个执行过程中,HTML解析的时候遇到了JavaScript标签,应该怎么办?
-
会停止解析HTML,而去加载和执行JavaScript代码;
-
-
那么,JavaScript代码由谁来执行呢?
- JavaScript引擎
认识JavaScript引擎
-
为什么需要JavaScript引擎呢?
- 我们前面说过,高级的编程语言都是需要转成最终的机器指令来执行的;
- 事实上我们编写的JavaScript无论你交给浏览器或者Node执行,最后都是需要被CPU执行的;
- 但是CPU只认识自己的指令集,实际上是机器语言,才能被CPU所执行;
- 所以我们需要JavaScript引擎帮助我们将JavaScript代码翻译成CPU指令来执行;
-
比较常见的JavaScript引擎有哪些呢?
- SpiderMonkey:第一款JavaScript引擎,由Brendan Eich开发(也就是JavaScript作者);
- Chakra:微软开发,用于IT浏览器;
- JavaScriptCore:Webkit中的JavaScript引擎,Apple公司开发;
- V8:Google开发的强大JavaScript引擎,也帮助Chrome从众多浏览器中脱颖而出;
浏览器内核和JS引擎的关系
- 这里我们先以Webkit为例,Webkit事实上由两部分组成的:
- WebCore: 负责HTML解析、布局、渲染等相关的工作;
- JavaScriptCore:解析、执行JavaScript代码;
-
在小程序中编写的JavaScript代码就是被JSCore执行的;
V8引擎的原理
-
我们来看一些官方对V8引擎的定义:
- V8是用C++编写的Google开源高性能JavaScript和WebAssembly引擎,它用于Chrome和Node.js等。
- 它实现ECMAScript和WebAssembly,并在Windows 7或更高版本,macOS 10.12+和使用x64,IA-32,ARM或MIPS处理器的Linux系统上运行。
- V8可以独立运行,也可以嵌入到任何C++应用程序中。
Parse对JavaScript源代码进行解析,包括词法分析和语法分析
const name = "why"
// 词法分析:
tokens: [{type: "keyword", value: "const"},
{type: 'identifier', value: 'name'}]
- 根据tokens进行语法分析,生成AST抽象语法树
- Ignition将ast转为字节码(因为不同的环境<window,Linux,mac>能执行的机器指令不同),字节码再转为汇编代码再转为机器指令
- TurboFan收集信息,比如类型信息(例如某个执行频率较高的函数),将这些字节码直接生成机器码。
- Deoptimization操作对机器指令进行反向操作,把机器指令转为字节码
V8引擎的架构
- V8引擎本身的源码非常复杂,大概有超过100w行C++代码,通过了解它的架构,我们可以知道它是如何对JavaScript执行的:
- Parse模块会将JavaScript代码转换成AST(抽象语法树),这是因为解析器并不直接认识JavaScript代码;
- 如果函数没有被调用,那么是不会被转换成AST的;
- Parse的V8官方文档:https://v8.dev/blog/scanner
- Ignition是一个解析器,会将AST转换成ByteCode(字节码)
- 同时会收集TurboFan优化所需要的信息(比如函数参数的类型信息,有了类型才能进行真实的运算);
- 如果函数只调用一次,Ignition会解析执行ByteCode;
- Ignition的V8官方文档:https://v8.dev/blog/ignition-interpreter
- TurboFan是一个编译器,可以将字节码编译为CPU可以直接执行的机器码;
- 如果一个函数被多次调用,那么就会被标记为热点函数,那么就会经过TurboFan转换成优化的机器码,提高代码的执行性能;
- 但是,机器码实际上也会被还原为ByteCode,这是因为如果后续执行函数的过程中,类型发生了变化(比如sum函数原来执行的是number类型,后来执行变成了string类型),之前优化的机器码并不能正确的处理运算,就会逆向的转换成字节码;
- TurboFan的V8官方文档:https://v8.dev/blog/turbofan-jit
V8执行的细节
- 那么我们的JavaScript源码是如何被解析(Parse过程)的呢?
- Blink将源码交给V8引擎,Stream获取到源码并且进行编码转换;
- Scanner会进行词法分析(lexicla annalysis),词法分析会将代码转换成tokens;
- 接下来tokens会被转换成AST树,经过Parser和PreParser:
- Parser就是直接将tokens转成AST树架构;
- PreParser称之为预解析,为什么需要预解析呢?
- 这是因为并不是所有的JavaScript代码,在一开始时就会被执行。那么对所有的JavaScript代码进行解析,必然会影响网页的运行效率;
- 所以V8引擎实现了Lazy Parsing(延迟解析)的方案,它的作用是将不必要的函数进行预解析,也就是只解析暂时需要的内容,而对函数的全量解析是在函数被调用时才会进行;
-
比如我们在一个函数outer内部定义了另外一个函数inner,那么inner函数就会进行预解析;