浏览器器内核拿到内容(渲染线程接收请求,加载网页并渲染网页),渲染大概可以划分成以下几个步骤:
- 解析HTML(HTML Parser)
- 构建DOM树(DOM Tree)
- 解析css构建render树(将CSS代码解析成树形的数据结构,然后结合DOM合并成render树)
- 布局render树(Layout/reflow),负责各元素尺寸、位置的计算
- 绘制render树(paint),绘制页面像素信息
- 浏览器会将各层的信息发送给GPU(GPU进程:最多一个,用于3D绘制等),GPU会将各层合成(composite),显示在屏幕上
这里先解释一下几个概念:
-DOM Tree:浏览器将HTML解析成树形的数据结构。
-CSS Rule Tree:浏览器将CSS解析成树形的数据结构。
-Render Tree: DOM和CSSOM合并后生成Render Tree。
-layout: 有了Render Tree,浏览器已经能知道网页中有哪些节点、各个节点的CSS定义以及他们的从属关系,从而去计算出每个节点在屏幕中的位置。
-painting: 按照算出来的规则,通过显卡,把内容画到屏幕上。
-reflow(回流):当浏览器发现某个部分发生了点变化影响了布局,需要倒回去重新渲染,这个回退的过程叫 reflow。reflow 会从 这个 root frame 开始递归往下,依次计算所有的结点几何尺寸和位置。
-repaint(重绘):改变某个元素的背景色、文字颜色、边框颜色等等不影响它周围或内部布局的属性时,屏幕的一部分要重画,但是元素的几何尺寸没有变。
注意:
-display:none 的节点不会被加入Render Tree,而visibility: hidden
则会,所以,如果某个节点最开始是不显示的,设为display:none是更优的。
-display:none 会触发 reflow,而 visibility:hidden 只会触发 repaint,因为没有发现位置变化。
-有些情况下,比如修改了元素的样式,浏览器并不会立刻reflow 或 repaint 一次,而是会把这样的操作积攒一批,然后做一次reflow,这又叫异步 reflow 或增量异步 reflow。但是在有些情况下,比如resize窗口,改变了页面默认的字体等。对于这些操作,浏览器会马上进行 reflow。
层(layer)
浏览器在渲染一个页面时,会将页面分为很多个图层,图层有大有小,每个图层上有一个或多个节点。在渲染DOM的时候,浏览器所做的工作实际上是:
-获取DOM后分割为多个图层
-对每个图层的节点计算样式结果(Recalculate style–样式重计算)
-为每个节点生成图形和位置(Layout–回流和重布局)
-将每个节点绘制填充到图层位图中(Paint Setup和Paint–重绘)
-图层作为纹理上传至GPU
-组合多个图层到页面上生成最终屏幕图像(Composite Layers–图层重组)
纹理(texture)
这里的纹理指的是 GPU 的一个术语:可以把它想象成一个从主存储器(例如 RAM)移动到图像存储器(例如 GPU 中的 VRAM)的位图图像(bitmap image)。一旦它被移动到 GPU 中,你可以将它匹配成一个网格几何体(mesh geometry),在 Chrome 中使用纹理来从 GPU 上获得大块的页面内容。通过将纹理应用到一个非常简单的矩形网格就能很容易匹配不同的位置(position)和变形(transformation),这也就是 3D CSS 的工作原理。
加速原理
浏览器接收到页面文档后,会将文档中的标记语言解析为DOM树。DOM树和CSS结合后形成浏览器构建页面的渲染树。渲染树中包含了大量的渲染元素,每一个渲染元素会被分到一个图层中,每个图层又会被加载到GPU形成渲染纹理,而图层在GPU中 transform 是不会触发 repaint 的,这一点非常类似3D绘图功能,最终这些使用 transform 的图层都会由独立的合成器进程进行处理。
合成层创建标准
Chrome中满足以下任意情况就会创建图层:
-3D或透视变换(perspective transform)CSS属性
-使用加速视频解码的节点
-拥有3D(WebGL)上下文或加速的2D上下文的节点
-混合插件(如Flash)
-对自己的opacity做CSS动画或使用一个动画webkit变换的元素
-拥有加速CSS过滤器的元素
-元素有一个包含复合层的后代节点(一个元素拥有一个子元素,该子元素在自己的层里)
-元素有一个z-index较低且包含一个复合层的兄弟元素(换句话说就是该元素在复合层上面渲染)
合成层的优点
一个元素开启硬件加速后会变成合成层,可以独立于普通文档流中,改动后可以避免整个页面重绘,提升性能。
-合成层的位图,会交由 GPU 合成,比 CPU 处理要快
-当需要 repaint 时,只需要 repaint 本身,不会影响到其他的层
-对于 transform 和 opacity 效果,不会触发 layout 和 paint
注意:
-提升到合成层后合成层的位图会交GPU处理,但请注意,仅仅只是合成的处理(把绘图上下文的位图输出进行组合)需要用到GPU,生成合成层的位图处理(绘图上下文的工作)是需要CPU。
-当需要repaint的时候可以只repaint本身,不影响其他层,但是paint之前还有style, layout,那就意味着即使合成层只是repaint了自己,但style和layout本身就很占用时间。
-仅仅是transform和opacity不会引发layout 和paint,那么其他的属性不确定。
性能优化
-提升动画效果的元素 合成层的好处是不会影响到其他元素的绘制,因此,为了减少动画元素对其他元素的影响,从而减少paint,我们需要把动画效果中的元素提升为合成层。 提升合成层的最好方式是使用 CSS 的 will-change属性。will-change 设置为opacity、transform、top、left、bottom、right 可以将元素提升为合成层。
-使用 transform 或者 opacity 来实现动画效果, 这样只需要做合成层的合并就好了。
-减少绘制区域 对于不需要重新绘制的区域应尽量避免绘制,以减少绘制区域。对于固定不变的区域,我们期望其并不会被重绘,因此可以将其提升为独立的合成层,减少绘制区域,需要仔细分析页面,区分绘制区域,减少重绘区域甚至避免重绘。
层的重绘
对于静态 Web 页面而言,层在第一次被绘制出来之后将不会被改变,但对于 Web 动画,页面的 DOM 元素是在不断变换的,如果层的内容在变换过程中发生了改变,那么层将会被重绘(repaint)。
需要注意的是,如果图层中某个元素需要重绘,那么整个图层都需要重绘。比如一个图层包含很多节点,其中一个节点发生变化,都会重绘整个图层的其他节点,然后生成最终的图层位图。所以这需要通过特殊的方式来强制这个节点拥用一个自己的图层(translateZ(0)或者translate3d(0,0,0)),CSS3的动画也是一样(好在绝大部分情况浏览器自己会为CSS3动画的节点创建图层)。
层和CSS动画
简化一下上述过程,每一帧动画浏览器可能需要做如下工作:
-浏览器解析 HTML 获取 DOM 后分割为多个图层(GraphicsLayer)
-对每个图层的节点计算样式结果(Recalculate style–样式重计算)
-为每个节点生成图形和位置(Layout–回流和重布局)
-将每个节点绘制填充到图层位图中(Paint Setup和Paint–重绘)
-图层作为纹理(texture)上传至 GPU
-组合多个图层到页面上生成最终屏幕图像(Composite Layers–图层重组)
如果我们需要使得动画的性能提高,需要做的就是减少浏览器在动画运行时所需要做的工作。最好的情况是,改变的属性仅仅印象图层的组合,变换(transform)和透明度(opacity)就属于这种情况。
现代浏览器如Chrome,Firefox,Safari和Opera都对变换和透明度采用硬件加速。
CSS 中的以下几个属性能触发硬件加速:
-transform
-opacity
-filter
-will-change
3D 和 2D transform 的区别就在于,浏览器在页面渲染前为3D动画创建独立的复合图层,而在运行期间为2D动画创建。动画开始时,生成新的复合图层并加载为GPU的纹理用于初始化 repaint。然后由GPU的复合器操纵整个动画的执行。最后当动画结束时,再次执行 repaint 操作删除复合图层。
强制使用GPU渲染
为了避免 2D transform 动画在开始和结束时发生的 repaint 操作,我们可以硬编码一些样式来解决这个问题:
.example1 {
transform: translateZ(0);
}
.example2 {
transform: rotateZ(360deg);
}
这段代码的作用就是让浏览器执行 3D transform。浏览器通过该样式创建了一个独立图层,图层中的动画则有GPU进行预处理并且触发了硬件加速。
如果某一个元素的背后是一个复杂元素,那么该元素的 repaint 操作就会耗费大量的资源,此时也可以使用上面的技巧来减少性能开销。
使用硬件加速的注意事项
-内存。如果GPU加载了大量的纹理,那么很容易就会发生内容问题,这一点在移动端浏览器上尤为明显,所以,一定要牢记不要让页面的每个元素都使用硬件加速。
-使用GPU渲染会影响字体的抗锯齿效果。这是因为GPU和CPU具有不同的渲染机制。即使最终硬件加速停止了,文本还是会在动画期间显示得很模糊。