写在前面
相信有很多朋友和我一样,之前听过数据分析,数据挖掘,数据开发等等概念或者角色,但是却对于数据洞察没有概念 。
本文尝试通过较为全面地讲述,让大家能够迅速建立起数据洞察的相关认知。
基本概念
数据分析/挖掘/洞察定义
这几个词很相似,我们来分别进行阐述 :
- 数据分析(Business Analysis):传统定义的数据分析,一般通过SQL/Python/Excel等工具汇总数据,结合对业务的理解和经验,主要是由人将数据转换为信息;
- 数据挖掘:一般通过建模来挖掘数据内在的关联和信息,主要是机器从训练集中发现一定的规律,从而将数据转换为信息;
- 数据洞察:通过数据分析/挖掘,将数据转换为信息,结合业务场景,梳理出影响业务结果的因素和作用链路,从而正确地对于问题进行归因和得出改进的方向。
所以我们可以看出数据分析和数据挖掘是殊途同归的,最终都收归于数据洞察的体系中。
如何理解数据洞察
可能上面关于数据洞察的定义还有一些晦涩,不好理解,接下来我说说我个人的理解:
- 数据分析和数据挖掘更加偏向于数据处理的手段,通过业务或者机器的方式将数据加工成一些信息 ,比如:啤酒和纸尿裤放在销售量比单卖要高;用户喜欢在夏天到来时才购买游泳装备等等。
- 而数据洞察更强调的对多种信息的加工和处理 —— 结合业务场景,产出对于业务发展有价值的结论。
既然数据洞察的目的是推动业务的发展,那么就需要我们以业务为导向,关注业务中实际遇到的需求或者问题。并且在得出结论后,能够产生可落地的action,去验证和迭代我们的结论,从而推动业务的发展。
我们用一张图来描述下数据洞察的一个完整链路 :
三要素
数据洞察的三要素为:数据、业务场景、标准
- 数据:我们得出的结论要基于数据,避免受到个案或者特例的影响 ;
- 业务场景 :少了业务场景,就无法理解孤立的数据对于业务的实际意义;
- 标准:结合业务场景,我们才能对于数据的好与坏制定出标准,比如说身高150对于成年男性可能不算高,但是对于小学生来说却是很高了;
具体操作
全景步骤
以上我们了解了数据洞察的一些基本概念,接下来我们来讲讲如何实际操作。
我在【数据向】系列的上一篇文章中产出了一次数据分析的完整流程 ,具体可见【数据向】(三)数据建模、数据挖掘、数据分析异同。这次我将上次的绘图融入进数据洞察的链路中,来展现数据洞察的全景步骤:
图上步骤主要分为以下几个层级:
- 业务层:结合业务的问题和需求,先定义需要哪些数据,以及这些数据在场景中的含义
- 数据层:通过数据埋点上报、业务数据库同步等方式获取业务所需的数据,进行相应的数据清洗,避免脏数据的影响;将数据进行合并和整理,便于分析;
- 分析层:通过数据分析或数据挖掘的手段从数据中获取规律、现象或者数据模型
- 输出层:结合分析层得到的信息和业务场景,输出洞察结论,制定行动计划;在行动后根据新产生的数据验证之前得到的结论的有效性,进行迭代;
最终通过以上的循环,我们可以不断地积累不同业务场景下的洞察结论。
如何从零培养数据洞察力
那么上面我们谈了数据洞察的全景步骤 ,接下来我们聊聊作为一个小白,我们如何从零培养自己的数据洞察能力呢?
- 首先从单个业务场景中的单指标开始着手:
- 可能整个业务链路很长,所以先从链路中的一个场景出发,比如电商购物,从流量入口的站外/站内,到产品详情页,到加入购物车,到确认购买页面,到最后付款流程;
- 先选择较大的异动进行分析如暴涨、暴跌:
- 在极端的情况下,比较容易定位背后的影响因素;
- 积累了结论后对于小幅度的波动也能够进行合理的解读了;
- 从静态到动态:总结周期性规律,结合时间轴
- 比如泳衣销售的暴涨暴跌可能是由于营销活动,或者天气突变;但是对于涨跌的分析是静态的,从一个点到另一个点的;
- 一些业务场景可能会有周期性特点,结合一连串的静态场景分析可以总结出周期性规律,比如上述的泳衣销售具有季节性周期的特点;再比如新闻的阅读具有生命周期的特点,刚出来时较热,后续逐渐转冷;
- 从单指标到多指标:比如分析游戏的收入时,结合活跃人数、付费转化率、客单价等多维度指标进行协同分析
写在最后
通过对数据洞察的了解 ,我们可以发现,数据洞察与业务的结合是非常紧密的 。每个洞察结论离开了其背后的业务场景可能都是无效的。所以数据洞察不存在“银弹“或者“万金油”,我们 还是要通过不断地实操进行场景上的积累 ,从而提升数据洞察力。