《数据分析思维:分析方法和业务知识》

来源: 猴子_数据分析学院 | 相对通识,比较基础

第一部分: 方法

1. 数据的分类有: 用户数据(包括姓名/性别/邮箱/年龄/家庭住址/教育水平/职业),行为数据(比如停留时间,浏览过的商品),产品数据(比如名称类别评论等等)

2. 常用的数据指标有哪些: 

用户数据 —— 新增用户(日新增用户数),活跃用户(活跃率-需要明确活跃的定义,是登陆,还是点击还是购买),留存用户(留存率);                 

行为数据——PV/UV/转发率/K因子(K-factor = 平均每个用户向多少用户发出邀请X接受到的用户转化为新用户的比例)等等;                    

产品数据 —— 比如成交总额,客单价,付费和复购率等业务总量指标 e.g. 电商行业的GMV,游戏行业的人均ARPU(average revenue per user), 例:18年淘宝的人均消费为8732元,京东4426元,拼多多673元; 

其他推广付费指标 e.g. CPC/CPM/CPA || CPC为按照点击次数收费,一般为搜索广告;CPM为按照展示次数付, 一般为展示位广告;CPD(按照App下载数付费), CPI (按照App激活数付费), CPS(按照购买的用户数或者销售额付费), 一般在信息流广告中常见,以投放实际效果看

3. 如何选择指标

我们会谈论北极星指标,是一个产品最为重要的指标。比如喜马拉雅最关心的指标就是一个用户进来他能听多久的音频。

4. 如何搭建指标体系和报表

明确部门KPI,找到一级指标 --> 了解业务运营情况,找到二级指标 --> 梳理业务流程,找到三级指标 --> 通过报表监控指标,不断更新指标体系

5. 常用的分析方法

- 逻辑树分析方法(将复杂的问题变得简单) 把问题看做树木的树干,通过不同的分枝,把问题拆解为一个个的子问题。通过解决单独的子问题,从而汇总得出问题的答案; 经常会有类似的费米问题: 比如深圳有多少产品经理,一个公交车能装下多少乒乓球?

    “例子: 问题 - 中国有多少钢琴调音师? 谁 — 调音师,调音师一般是调节钢琴,那可以变成钢琴的数量  X 每个钢琴每年调多少次音 X 调一次需要多久 / 一位调音师每年工作的时间 —> 钢琴一般出现的场景在哪里? 钢琴乐器店,自己购买钢琴的家庭,演出场所,学校教育机构;+ 每个钢琴估计一年1次 + 一年工作50个星期按照一周5天每天8小时 每个调音师每年工作2000小时 —> 计算出结果

- PEST分析方法(通常用于行业分析)

    政治: 政府的法律投资税收政策等等 // 社会: 一个地区的人口年龄收入分布购物习惯等等// 技术环境: 包括一些外部创新技术//

- 对比分析

    和谁比: 和自己比 + 和行业比; 比较数据整体的大小(平均数中位数),数据整体的波动(变异系数)及趋势变化(时间折线图 环比和同比); 以及A/B测试 

- 假设检验分析

       提出假设 —> 收集证据 —> 得出结论; (从用户/产品/竞品三个维度提出假设,收集用户数据产品数据竞品数据, 最后用数据去反复验证)

- 相关分析方法

    相关分析的作用: 在研究两种或者两种以上数据之间有什么关系或者某个事情收到其他因素影响的问题时,可使用相关分析。

    相关系数,通常用r表示,正负表示相关方向,范围为-1~1。-1,1,0为极值。

    如何判断两个数据之间是不是 相关关系,需要使用单变量控制方案

- 群组分析方法

    按照某个特征,把数据分为不同的组。例子: 按照用户开始使用产品的月份

    例子: twitter开始去关注30个好友,是发现的分组"某月份用户用推特的天数"和留存率有关系(核心用户 - 每个月至少访问7天的人/一般用户 - 使用产品不那么频繁的人/冷漠用户-使用一次产品后再也不用的人) 分完组和相对应的比例,再进行假设检验可以思考可能性

- RFM分析方法

    R代表Recency 最近一次消费时间,F代表Frequency 消费频次(一段时间), M代表Monetary 消费金额(一段时间)

    * 计算RFM的值,用户名称或ID + 消费时间 + 消费金额; 

    *给RFM值按价值打分,比如将RFM3个指标按照价值从小到大为1~5分,对于R,大于20天的打1分,10~20天打2分,5~10天打3分,3~5天打4分,3天以内打5分

    * 计算R F M价值平均值

    * 进行用户分类,高于维度价值平均值的为高净值的用户(高低高低高低,区分出8种用户)

    * 比如 重要价值用户,RFM三个值都很高

RFM

- AARRR模型分析方法


- 漏斗分析方法

- 5W2H (What 是什么,when 何时,where 何地,why 为什么,who是谁)

6. 用多种分析方法解决问题

 思路: 确定问题 —> 分析原因—>提出建议

e.g. 某个店铺上半年完成的利润很低,要找出利润没有达标的原因,以及完成年度目标的方案。确定问题是A. 需要明确时间地点和数据来源 B. 明确其涵盖的指标意义和相比较的对象


1) 首先例子中的问题是,利润没有达到目标(计划为3000万,实际完成1991.37万),落后于计划1008.63万,需要解决,以及如何完成下半年指标;其业务指标: 利润的含义如何定义 = 销售收入 - 销售成本 - 营业外支出,销售收入 = 客单价 X 用户数,销售成本 = 商品成本 + 实现销售付出的成本,营业外支出 = 各种非盈利的支出比如捐款等


2) 明确好问题后,我们需要分析原因。此处我们会先对利润进行拆解,按照上面的业务指标可能由这么些要素组成,再去分别追溯数据。发现上半年的销售成本出现明显增长,但销售成本和销售收入直接关系,在费率比逐步下降的情况下,销售费用上升并非是利润不达标的原因。接下来再去分析商品采购成本,与去年上半年同期相比,是低于的,也不是不达标的原因。销售收入对比后发现,今年上半年总销售收入比去年下降了8.79%;再在销售收入的组成元素里去拆解,分析客单价和用户数,发现客单价变化不大反而用户数量下降了。接着去分析用户数量下降的原因。

将用户按照用户,产品,竞品三个维度去拆解,从业务流程出发,去做假设和分析思路



提出建议这一步,通常需要回归分析和AARRR模型。

第二部分: 实战

【电商行业】

模式: B2C,B2B,C2C,O2O模式; 重点业务指标: 新老用户, 复购率(反映忠诚度)和回购率(使用场景不同,分析大促对于用户的吸引力 -- 大促期间购买的用户数/某段时间的购买用户数),人指标 --- 用户交易常用指标包括进店浏览访问UV,加购UV,收藏UV,购买的GMV,支付转化率,折扣率以及退货指标; 货指标 --- 备货指标包括 SPU/SKU数量和备货值,售卖比(GMV/备货值,用来看商品流转情况去优化库存),动销率(有销量的SKU数量/在售的SKU数量)

例子: 2019年双11结束后,某店的KPI未达成,首次交易的新用户数量可观,可能与已购用户销售表现有关(老用户); 

> 明确问题: 2019双十一用户回购率下降的原因

> 分析原因: 多维度拆解 + 对比分析法 + 假设检验方法确认原因

大促回购率 = 一定时间的购买人数/当期的购买人数, 已知2017年双11的回购比例8.79%,2018双11的回购比例8.07%,2019双十一回购比例7.71%(用户基数和双11回购人数是一直在增长的,但是由于回购人数的增长率小于回购率的增长,导致整体看下来老用户的回购金额下降。那么新增人数里面哪些人回购表现不佳,变成我们探究的原因。

下面我们来拆解用户,简单的采取以下RFM模型,先从单独R的基数值看,划分不同的老用户 R <=365 365<R<730,目前看没有明显下降。再去拆F,简单拆一下F>1,F=1发现2019年的购买次数1次的用户回购率同比低了9.27%,而购买多次的用户回购率同比只减少了0.81%;只够买一次的用户变二次复购变得更难了。接下来要将F=1的用户单独拿出来进行更细致的分组。

在细致拆分后 发现距离2019.11.11的R为90天和180天的用户,回购率特别低。去提出落地优化方案;

一般电商促销运营活动的数据: 

A. 总体运营情况: 备货值,销售额,售卖比,SKU数,SPU数,销量,客单价,UV,收藏数,加购数,转化率,折扣率,毛利率; 一般如何分析?

B. 活动的商品结构, e.g.将数据按照价格维度来拆解,比如500~800的售卖量集中,转化率好。e.g. 按照折扣区间去拆解

R
细分F=1的用户的R情况

【金融信贷行业及金融第三方支付行业】此处不感兴趣就不赘述了

信贷行业模式: 金融机构包括银行,证券公司,保险公司,信托公司,网贷公司,第三方支付公司,金融科技公司等等; 

第三方支付公司模式: 为现在商户提供收费终端商品(如扫码枪,付款码等等) 更偏TOB

【家政行业】此处不感兴趣就不赘述了

行业模式: 服务提供方 -->家政平台 <--服务需求方,整体的数据分析也就是一个长业务链每一部分的转化率分析

【旅游行业】

传统模式: 用户 —> 旅行社 —> 安排目的地旅游

新模式: 用户 —> 平台 <—— 旅行社,平台比价和下单; 业务流程指标:下单人数,出游人数,人均团费,复购率/转化率,投诉率

案例: 旅行社想看下投诉对于用户下一年复购的影响,首先先从业务数据上看,有投诉的组和没投诉的组相比,下一年的复购率 一个有43%,一个只有26%,说明相关。然后需要提出建议。// 从业务流程上提出假设,可能是售前,售中,售后做的不好,然后去统计投诉的类型,发现售中投诉占比82%; 再去拆分售中的业务有餐饮交通酒店导游行程等,再去看F地90%总体投诉量集中在售中-行程上。

【在线教育行业】

模式: 录播课+直播课//前台展示通常为App,网站,小程序等。

业务指标: 一般转化方式还是免费课转正价课。免费试学阶段包括:点击次数,点击率,点进概率,弹出率(具体还要看免费课的载体决定,梳理业务转化漏斗) // 观察用户的ARPU ARPPU,付费用户的消费意愿越高,平台收入越多。// 上课学习阶段指标包括 出勤率,完课率,课程评价数,好评率等等; 

【运营商行业】

业务模式: 指的是提供网络服务的供应商。i.e. 中国移动,中国联通,中国电信;常见为存量运营,通过电话营销去维系用户和提升用户价值,比如把A套餐换为B套餐; 

常用数据指标: 出账用户数,用户保有率,收入保有率,用户流失率,项目增收(某个产品收入增加);

【内容行业】

业务模式: 一般以文章,图片,视频为内容载体去满足用户阅读/学习/消遣需要。

主要指标:

- 内容生产指标

    内容生产者比例来衡量一个平台内容的生产健康度; 

    内容更新总数为内容平台每天更新的内容数,主要分为UGC/PGC 

    内容更新频次为一段时间内内容更新的总量/时间周期

- 内容曝光指标

    人均曝光次数指某类内容的人均曝光次数

- 内容点击指标

    内容平均点击数/曝光点击率

- 内容阅读指标

    完成阅读的人/总阅读人数,体现内容质量

- 内容评论指标

    评论用户数/评论率

- 内容分享指标

    用户分享率/内容分享用户数/内容实际产生价值(包括广告/分成/订阅付费等等)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345

推荐阅读更多精彩内容