CPU和GPU
在屏幕成像过程中,CPU和GPU起着至关重要的作用
CPU负责对象的创建和销毁、对象属性的调整、布局计算、文本的计算和排版、图片的格式转换和解码、图像的绘制
GPU负责纹理的渲染
卡顿产生的原因
我们图像呈现在屏幕上首先是CPU把数据计算好,然后GPU把CPU计算好的数据渲染到屏幕上。垂直同步信号GPU渲染好的图像呈现在屏幕上,这样就是一桢的显示,然后马上进入下一桢,下一桢又要进行CPU的计算和GPU的渲染,有可能这一次GPU很早就把数据渲染完了,然后等待垂直同步信号的到来。也有可能是GPU渲染的时间比较长,当垂直同步信号来了还没渲染完,那么这个垂直同步信号就将上一桢的图像呈现出来了,那么这一桢的数据就丢失了,也就叫掉桢。这样就产生了卡顿
离屏渲染
在OpenGL中,GPU友2种渲染方式
- 当前屏幕渲染,在当前用于显示的屏幕缓冲区进行渲染操作
- 离屏渲染,在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作
离屏渲染消耗性能的原因
- 需要创建新的缓冲区
- 离屏渲染的整个过程,需要多次切换上下文环境,先是从当前屏幕(On-Screen)切换到离屏(Off-Screen);等到离屏渲染结束以后,将离屏缓冲区的渲染结果显示到屏幕上,又需要将上下文环境从离屏切换到当前屏幕
卡顿解决的主要思路
尽可能减少CPU、GPU资源的消耗
按照60FPS的刷桢率,每隔16ms就会有一次垂直同步信号
卡顿优化-CPU
- 尽量使用轻量级的对象,比如用不到事件处理的地方,可以考虑使用CALayer取代UIView
- 不要频繁地调用UIView的相关属性,比如frame、bounds、tranform等属性,尽量减少不必要的修改,因为改变了这些属性,CPU又要对UIView进行重新计算和渲染。
- 尽量提前计算好布局,在有需要时一次性调整对应的属性,不要多次修改属性
- autolayout会比直接设置frame消耗更多的CPU资源
- 图片的size最好跟UIImageView的size保持一致
- 控制一下线程的最大并发数量
- 尽量把耗时的操作放到子线程,比如文本处理(尺寸计算、绘制),图片处理(解码、绘制)
卡顿优化-GPU
尽量减少视图数量和层次
尽量避免短时间内大量图片显示,尽可能将多张图片合成一张进行显示
GPU能处理的最大纹理尺寸时4096x4096,一旦超过这个尺寸,就会占用CPU资源进行处理,所以纹理尽量不要超过这个尺寸
减少透明的视图(alpha< 1),不透明的就设置opaque为YES
尽量避免出现离屏渲染,以下操作会出现离屏渲染:
光栅化,layer.shouldRasterize = YES
遮罩,layer.mask
圆角,同时设置layer.masksToBounds = YES,layer.cornerRadius大于0(可以通过直接提供圆角图片或者CoreGraphics自己绘制圆角)
阴影,layer.shadowXXX(如果设置了layer.shadowPath 就不会产生离屏渲染)
卡断监测
平时所说的卡顿主要是因为在主线程执行了比较耗时的操作
可以添加Observer到主线程RunLoop中,通过监听RunLoop状态切换的耗时,以达到监控卡顿的目的
耗电优化
以下几方面优化
- CPU处理
- 尽可能降低CPU、GPU功耗
- 少用定时器
- 优化IO操作,尽量不要频繁写入小数据,最好批量一次性写入
- 读写大量数据时,考虑用dispatch_io,其提供了基于GCD的异步操作文件IO的API。用dispatch_io系统会优化磁盘访问,如果数据量比较大的,建议使用数据库(比如SQLite、FMDB、CoreData)
- 网络请求
- 减少、压缩网络数据
- 如果多次请求的结果是相同的,尽量使用缓存
- 使用断点续传,否则网络不稳定时可能多次传输相同内容
- 网络不可用时,不要尝试执行网络请求
- 让用户可以取消长时间运行或者速度很慢的网络操作,设置合适的超时时间
- 批量传输,比如,下载视频流时,不要传输很小的数据包,直接下载整个文件或者一大块一大块地下载。如果下载广告,一次性多下载一些,然后再慢慢展示。如果下载电子邮件,一次下载多封,不要一封一封地下载
- 定位
- 如果只是需要快速确定用户位置,最好用CLLocationManager的requestLocation方法。定位完成后,会自动让定位硬件断电。
- 如果不是导航应用,尽量不要实时更新位置,定位完毕就关掉定位服务
- 尽量降低定位精度,比如尽量不要使用精度最高的kCLLocationAccuracyBest
- 需要后台定位时,尽量设置pausesLocationUpdatesAutomatically为YES,如果用户不太可能移动的时候系统会自动暂停位置更新
- 尽量不要使用startMonitoringSignificantLocationChanges,优先考虑startMonitoringForRegion:
- 图像
APP的启动优化
app的启动分为2种
冷启动:从零开始启动
热启动:APP已经在内存中,在后台存活着,再次点击图标启动APP
APP启动的优化,主要是针对冷启动优化:
通过添加环境变量可以打印出APP的启动时间分析(Edit scheme -> Run -> Arguments)
DYLD_PRINT_STATISTICS设置为1,如果需要更详细的信息,那就将DYLD_PRINT_STATISTICS_DETAILS设置为1
APP的冷启动包括以下3大阶段:
- dyld:用来装载Mach-O文件(可执行文件、动态库等)
- 装载APP的可执行文件,同时会递归加载所有依赖的动态库
- 当dyld把可执行文件、动态库都装载完成后,会通知Runtime进行下一步的处理
- runtime:使用Runtime初始化OC的结构,类,分类
- 调用map_images进行可执行文件内容的解析和处理
- 进行各种objc结构的初始化(注册Objc类 、初始化类对象等等)
- 调用C++静态初始化器和attribute((constructor))修饰的函数
-
main:main函数调用
APP启动优化
- dyld
减少动态库、合并一些动态库(定期清理不必要的动态库)
减少Objc类、分类的数量、减少Selector数量(定期清理不必要类、分类)
减少C++虚函数的数量
Swift尽量使用struct - runtime
用+initialize方法和dispatch_once取代所有的attribute((constructor))、C++静态构造器、ObjC的+load - main
在不影响用户体验的前提下,尽可能将一些操作延迟,不要全部都放在finishLaunching方法中
按需加载
安装包瘦身
安装包主要由可执行文件、资源组成
- 资源(图片、音频、视频等)
- 采取无损压缩:熊猫压缩
- 去除没有用到的资源:https://github.com/tinymind/LSUnusedResources
- 可执行文件瘦身
- 编译器优化
Strip Linked Product、Make Strings Read-Only、Symbols Hidden by Default设置为YES - 去掉异常支持,Enable C++ Exceptions、Enable Objective-C Exceptions设置为NO, Other C Flags添加-fno-exceptions
- 利用AppCode(https://www.jetbrains.com/objc/)检测未使用的代码:菜单栏 -> Code -> Inspect Code
- 编写LLVM插件检测出重复代码、未被调用的代码
**LinkMap可以查看可执行文件的具体组成
https://github.com/huanxsd/LinkMap