一、数据异动根因分析的背景介绍
业务考虑的最重要的问题是,业务现状怎么样,出现什么问题,原因是什么,可能的解决方案是什么?而回答这些的是数据分析的思维。
数据异动根因分析的特色不仅是发现数据异动,而是使用专家经验,分析框架,定位问题,说明原因。
数据端异动发现:
1、异动发现
1.1、人工配置阈值:
人工配置指标的同比环比阈值、指标的上限下限,超出人工配置的阈值即认为是数据异动,这是目前数据异动的主流方式。
优点就是人工可以灵活干预,缺点是人工维护很多阈值,且在不同的业务阶段,阈值要不断更新,给人增加很多工作量,且这个异动判断人为因素太重,不科学
1.2、时间序列预测模型:
通过回归模型,时间序列(如:移动平均,指数平滑...)算法对数据进行预测。
优点:可以根据数据的变化趋势,周期等因素。更好的预测出更合理置信区间。减少了人为干扰因素。缺点:无法将一些特定的人为活动(如:营销活动)等因素考虑进去,最终导致实际数据超出预测范围(置信区间),但是结合规则系统是可以弥补的。
2、异动分析框架
2.1 关联分析:梳理核心指标的关联指标,当核心指标发生异动时,先定位相关指标是否发生异常。例如完成订单量异常,要关注呼叫订单量是否异常。
2.2 多维分析:对指标进行多维度拆解。当关联指标发生异动时,要确定哪些维度对核心指标的异动影响最大。
2.3 事件分析:检查异常日是否有新事件发生,例如 重大节假日、线上活动、异常天气、产品发布日等
总结:一般可以基于对业务理解先确定指标,然后通过相应分析粒度,定位相应的问题!