一、离线统计方案概述
离线统计在App使用过程中,不断采集统计数据,写入内存缓存或本地文件,并通过相应的策略控制,在合适的时机统一上报,由于这种方式将多条统计数据合并成一个上报请求,而且上报前会做Gzip压缩,因此对性能和流量几乎没有影响,但由于它不是立即上报,取决于多种策略和时机控制,因此在实时性方面表现略差,但是可以通过多种策略来尽量保证其实时性,另外,由于离线日志会先通过内存缓存的方式收集,因此在App遇到异常中止时,会出现日志丢失的情况。
二、离线统计方案工作流程
- 统计埋点产生一条日志
- 将该日志加入内存缓存中,并检查当前缓存条数是否>20
- 如果缓存条数>20,则将全部缓存一次性写入日志临时文件WMStat.dat,然后检查日志文件大小是否>10KB
- 如果日志文件>10KB,将该文件拷贝至上报缓冲区,然后做Gzip压缩
- 遍历缓冲区内未上报成功的文件,检查每个文件的上报次数
- 如果文件上报次数已超过3次,则直接删除该文件(该文件内日志将会丢失),否则发起网络请求进行上报
- 如果上报成功,则从缓冲区内删除该文件,否则将上报次数+1,等待下次上报
上述这个主流程,发生在App的使用过程中,会随着统计的产生,不断的触发,但由于App本身使用过程中可能出现的不稳定性、以及日志文件达到上报阈值的时间点不确定性,因此为了让日志回收的更及时彻底一些,我们在一些App常见时机触发了特殊的上报策略,分别是:
- App每次启动时,会检查上报缓冲区内是否存在待上报文件,若存在,立即上报
- App从前台进入后台时,会将内存缓存内的日志文件立即写入本地文件(不检查条数是否>20条),并将日志文件迅速压缩上报(不检查大小是否>10KB),保证日志文件尽可能被回收,避免丢失过多