一. 数据分析的结构层次
1. 收集底层数据 从用户行为--原始数据
2. 数据业务化原始数据--加工数据(包括整理数据、清洗数据等)
3. 数据可视化加工数据--可视化数据(工具:Excel、Tableau、Python等)
4.数据决策和执行可视化数据--数据决策
5.数据模型数据决策--数据产品
6. 数据战略 数据工具--数据体系
在进行数据分析的过程中,需要Excel、Python、统计学、SQL、业务知识、 数据思维相关的积累,进行一个更为明确的综合分析与判断。
二. 数据分析的三种思维
1. 结构化:层层递进(思维导图形式)适合头脑风暴
建立核心观点,同时结构拆解:自下而上,层层拆解,上下呈因果或依赖关系。同级论点之间相关独立,完全穷尽,论点之间要避免交叉和重复,验证:用数据说话
2. 公式化:加减乘除
不同类型的业务的叠加可以使用加法,减法常用计算业务间的逻辑关系,乘法和除法则是各种比例和比率。例如:销售额:销量*客单量、利润:销售额-成本、客单价:原价*折扣率
3. 业务化:接地气,结合实际
好的数据分析思维,本身也是具备业务思维的,在分析中需要多思考是否有从业务角度出发,分析的是否是真正原因,分析结果能否,在分析中要多与业务方沟通交流,尽量参与到业务工作中去。
三. 数据分析的思维技巧
1. 象限法(策略驱动的思维)
优点 直观清晰、对数据进行人工的划分。划分结果可以直接应用于策略
须知 象限划分可以按照中位数,也可以是平均数,或者是经验
应用 适用范围广、战略分析、产品分析、市场分析、客户管理、用户管理、商品管理等
举例 以价值度为X轴,以流失度为Y轴,对用户群体进行细分,其中价值度高、流失度高为第一象限,价值度低、流失度高为第二象限,价值度低、流失度低为第三象限,价值度高、流失度低为第二象限
著名的RFM模型就是依据八象限划分 注:R(最近一次消费)F(消费频率)M(消费金额)
2. 多维法(类似魔方划分,精细驱动的思维)
优点 处理大数据量、维度丰富且复杂的数据有较好的效果,但是维度过多,会消耗不少时间
须知 对不同维度进行交叉分析时,需要注意辛普森悖论
应用 只要数据丰富且齐全,均可以应用
维度举例 ① 用户统计维度:性别、年龄用户行为维度:注册用户、用户偏好、用户兴趣、用户流失 ②消费维度:消费金额、消费频率、消费水平 ③商品维度:商品品类、商品品牌、商品属性
注:辛普森悖论--即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。 解决方法-钻取(维度细分)
3.假设法(启发思考驱动的思维)
优点 当没有直观数据或者线索能分析时,以假设现行的方式进行推断,这是一个论证的过程
须知 不止可以假设前提,也能假设概率或者比例,一切都能假设,只要自圆其说
应用 更多的是一种思考方式,假设-验证-判断
举例商品提价后对收入变化的假设(假设提价后,销量下降→假设流量不会变化,而价格影响转化率→找到原有转化率,预估提价后的转化率变化,假设不同用户对价格的敏感度不同(忠实、普通、羊毛党)→再根据不同层次用户的数量,按照经验对其做出假设,最后汇总)
4. 对比法(孤数不证)--数据挖掘规律的思考方式
优点 可以发现很多数据间的规律,可以跟任何思维技巧结合,如多维对比,象限对比,假设对比
应用 对比更多的是一种习惯,是数据分析的牛角尖,一次合格的分析,一定要用到N次对比
常见对比 竞争对手对比、类别对比、特征和属性对比、时间的同比环比、转化对比、前后变化对比
5.二八法(只抓重点的思维)
优点 和业务紧密相关,和KPI更紧密相关,几乎花费最少的精力就能达到不错的效果,性价比很高
须知 在条件允许的情况下,数据依旧不能放弃全局,否则会让思维变得狭隘
应用 二八法则存在于几乎所有的领域,所以这种分析思维没有局限
注意 数据中,20%的变量将产生80%的效果,数据分析更应该围绕这20%做文章。持续关注TopN的数据,是一个非常好的习惯,尤其在部分行业
6. 指数法(目标驱动的思维)
优点 目标驱动性强,直观,简洁,有效。对业务有一定的指导作用,一旦设立指数,不易频繁变动。
须知 使不知如何应用的数据能有一个有效性的方向,使其成为目标指数,通过将数据加工为指数,达到聚集的目的
应用 和假设法不同,假设法是缺乏有效的数据,指数法是无法利用数据而将其加工为可以利用的
方法 线性加权、反比、log(log收敛,使得值差距不会很大)
7.漏斗法(流程化的思考方式)
优点 单一的漏斗分析没有用,要和其他的分析思维相结合,比如多维、对比
须知 单一的转化率没有,单一的转化率没用
应用 涉及到变化和流程的都要用
本笔记由观看《七周学会数据分析》后整理
更多内容请关注公众号--李的读书观影笔记