注:内容来源于网易云课堂产品经理微专业
一、数据分析概述
数据是量化事物的手段,数据指标代表了现实存在的客观情况,客观性是数据最大的魅力所在。但人对数据不同的分析方法和手段融入了主观因素加工,可能会导致相同的数据得出完全相反的结论(例如辛普森悖论)。1%的疏忽导致100%的失败,数据的证明力是有两面性的,在做数据分析时务必严谨负责,也不要过分依赖数据分析而限制了产品本身的灵感和创意。
因此,在对数据进行解读时,要涵盖数据样本范围、提取手段、样本数量、数据来源、是否经过二次处理、样本是否完整(在总体的占比)等,判断数据能证明哪些问题,不能证明哪些问题,不要行动了才知道这个功能只有小部分用户在用。要深挖数据背后的原因,就需要我们对数据多问为什么,通过逻辑推理,提出有的放矢的追问和假设,然后通过数据或其他手段来验证,好的追问能够帮助我们发现数据中隐藏的问题。
1.1、数据分析的三种类型
数据分析按目的的不同可以分为描述性数据分析、探索性数据分析、验证性数据分析。
描述性数据分析属于初级数据分析,在统计学中,描述统计是将研究中所得的数据加以整理、归类、简化或绘制成图表,以此描述和归纳数据的特征及变量之间的关系的一种最基本的统计方法。一般来说什么数据都可以作描述性分析,常见的分析方法有:对比分析法、平均分析法、交叉分析法。
探索性数据分析及验证性数据分析侧重于在数据中发现新的特征,属于高级数据分析。不同之处在于,前者注重于对数据进行概括性的描述,不受数据模型和科研假设的限制,而后者只注重对数据模型和研究假设的验证(无目的/有目的)。常见分析方法有相关分析、因子分析、回归分析等。
(来自:《谁说菜鸟不会数据分析》)
1.2数据分析与大数据
大数据必须包含三个要素:用全部数据、注重相关关系、全新的计算方法。没有包含这三个要素就只是普通的数据分析而不是大数据。
用全部数据:当通过数据分析一个问题时,涉及到所分析问题的所有数据都必须纳入到计算范围当中,无论是常规合理数据,还是一些异常的样本数据都必须包含。甚至传统数据分析当中可能都完全忽略的数据,都需要包含在大数据分析当中。
注重相关关系:通过大数据分析,最终分析获得并关注数据当中的相关关系,并通过相关关系指导分析、决策预测,但对因果关系的探索,将不再是这种数据分析所关注的核心内容。
全新的计算方法:即大数据分析,其计算过程不再是传统的数据分析中,必须精确统计、不容许任何脏数据、错误数据的分析方法,而是包含了各类混杂数据的简单相关性计算。
二、数据驱动产品
数据分析应贯穿产品工作始终,产品开发迭代中也要保持数据敏感性,即平时注意积累数据信息,遇到不懂的信息立刻想到通过数据的因果联系,读出其中蕴含的产品趋势、变化原因及应对方法。
2.1产品三个阶段的数据分析需求
立项前的数据分析:更多停留在商业层面的分析及竞品分析,前几章需求分析时有讲到。
产品迭代数据分析:更多关注功能本身的表现,通过数据进行迭代,这也是本章重点。
产品衰落数据分析:其实这时候该重新立项或者分析战略转型方向起死回生了。
2.2数据驱动产品的方法
在进行数据分析之前,我们首先要对产品和业务流程有深入了解,也包括产品算法、玩法、形势、相关影响因素等。了解这些内容的原因是每个产品有都自身独特的指标,指标对不同产品的重要程度都有所差别,因此我们要梳理跟分析问题相关的指标及重要性,确认分析需要的时间周期等。
提出数据需求的过程,是一个“界定产品目的和目标,根据目标提出假设、预判产品效果”的过程,要求对功能目标、功能预期效果有完整且清晰的掌握。确定了产品指标之后,就可以在网站监测工具中设立各种功能、页面的监测指标。一些重要产品可能不会随意使用第三方网站监测工具,因此在设计时也要考虑到如何设置跟踪这些指标。
一旦发现数据指标与预设目标不同、有所变动、出现异常数据,就可以提出问题、进行跟踪调查。数据能引导我们定位问题,通过具体数据发现具体行为的共性特点,最后找到产品设计的问题,看最终改版后数据是否回归预期。
除了日常监测,在我们收集到的其他数据中,也可能包含对产品发展有利的数据,这时可能会用到一些探索性数据分析方法,对用户进行画像等。
案例:网站注册流程功能的数据统计需求
1、注册流程的完整方案设计文档。-根据方案设计确定统计方法。
2、做这个功能的意义:让所有新用户快速完成注册流程,并正确提供所需的必要个人信息。-根据目的统计哪些数据,及功能完成情况。
3、所需指标及定义:围绕2中的目标设计所需的数据指标,思考哪些数据指标,可以描述目标完成情况;比如:每一个注册环节的用户跳出率,每一个注册填写字段的出错率,各类注册错误的出现频次分布等。-回溯功能合理性,如果找不到直接的数据指标来统计这个功能那就需要思考是否真正抓住用户需求/是否在产品阶段有必要去做。
2.3数据驱动产品闭环
发现问题-确定指标-产品设计-开发测试-产品上线-数据验证
三、如何获取数据
3.1常用分析工具
网站:
网站排名工具:Alexa、中国网站排名、网络媒体排名
网站监测工具:Google Analytics、百度统计、CNZZ
APP:
国内分析工具:友盟、TalkingData
国外分析工具:Flurry,Google Analytics
Crash分析工具:Crashlytics(关注新功能小机型crash、BUG率,尽量避免流失)
3.2获取数据的方式
1、分析日志
程序员记录日志-分析师/产品经理给出计算逻辑-程序员计算指标-excel分析或报表。
缺点:周期长、产品经理需对指标计算逻辑清楚。
2、第三方分析工具
第三方分析工具可以自定义事件、转化漏斗、参与深度。
缺点:网站文件被第三方获取(可以利用开源网站/APP分析工具,自行架设跟踪)。
四、常用数据指标
4.1网站数据指标:
访问量:Session,一段时间访问量就是这段时间内的会话次数。每次会话都会编号一个sessionID=x,30分钟内无操作/关闭浏览器=同一次会话。
访客数:Unique Visitor,依据用户的设备、浏览器分配Cookie,访客数=网站cookie数。
浏览量:PageViews,cookie浏览页面的数量。
页面停留时长:该页面的总停留时长除以该页面的访问量。
网站停留时长:指访问一次会话的时间长度,等于网站所有访问量的总停留时长除以访问量。
跳出率:网站的重要指标。指从这个页面进入网站,没做任何事就从这个页面退出,等于只访问了落地页面的访问量除以总访问量。
退出率:衡量某个页面退出网站的比例,指无论从哪个页面进入网站,最终从这个页面退出的比例。等于从一个页面的退出次数除以访问次数。
转化率:达成某种目标的访客数占总访客数(访客数换成访问量也是同样成立的)
tips:关于采用访问量还是访客数作为分母?如果将访客量作为分母,这回认为一个访客在购买之前,多次访问是正常的。
4.2移动应用类数据指标(参考下文AARRR模型)
用户获取阶段(下载-激活):
1.下载量(已下载应用的用户数量,以及应用商店排名和评分,靠前助于吸引下载)
2.安装激活量(安装并打开应用的设备数)
3.激活率(激活设备数/安装设备数)
4.新增用户数(如果设备是首次激活应用,那么这个设备就是新增)
5.用户获取成本(每获取一个用户所需要的费用)
用户活跃与参与阶段(使用应用):
数量指标
1.日活跃用户数
2.月活跃用户数(一段时间内启动过应用的设备数,表示用户规模)
质量指标
3.活跃系数(日活/月活)
4.平均使用时长(平均每个用户一天使用应用的时间)
5.功能使用率(使用某功能的用户数占活跃用户的比例)
用户留存阶段(迭代新内容防止流失):
1.次日留存率
2.7日留存率
3.30日留存率
tips:统计日期新增的用户或活跃用户,在第N天又来使用的比例。可以参考行业值来对标自己应用的留存是否健康。
用户转化阶段(让用户付费):
1.付费用户比例(付费用户站总用户的比例。付费用户和免费用户的行为差别、流失率、营收差别很大。建议将付费用户和免费用户区别对待)
2.首次付费时间(用户激活多久后才会开始付费。有助于把握转化用户的时间点)
3.用户平均每月营收(月收入除以月活跃用户数)
4.付费用户平均每月营收(月收入除以月付费用户数)
4.3电商类数据指标
重要指标:
销售额:网站的收入
购买客户数:购买了商品的人数,会按照帐号去重计算。统计新老客户,增长速度、回购率。
客单价:每个客户购买的金额,等于销售额除以购买客户数
购买转化率:访客中购买了商品的比例,购买客户数除以访客数(UV)
UV(访客数)
详情页UV(IPV_UV)
订单数:订单数关系到支付压力和仓库发货的任务量
妥投及时率:妥投到客户的订单中,按照约定时间妥投的比例。
重点商品缺货率:爆款缺货的比例
常用公式:
销售额=UV*转化率*客单价
UV*转化率=购买客户数
转化率*客单价=访问价值
客单价=人均购买件数*件单价
客单价变动-件单价-热销商品价格变动/人均购买件数-组合装、单件装比例/推荐效果
2.4UGC类数据指标
UGC目标:让用户产出内容。因此从访客到产出内容的用户参与度逐渐加深。
重要指标:
访客数:Web端访客数+移动端访客数
登陆访客数及占比:登陆的访客数占总访客的比例
沉默用户数及占比:超过7天未产生内容的账号数占总账号数的比例
平均停留时长:总停留时长除以访客数
点赞、推荐、分享、评论、创作访客户数及占比=功能使用访客/登录访客数
UGC依赖优质内容,筛选出优质内容的一般公式:
热度=分享次数+推荐次数+点赞次数(访客参与度)
2.5数据指标分析案例
网站类:
1.有多少访客访问网站,访问深度怎么样?
查看GA上的“受众群体”概览页来了解网站的访客数和访问深度,结合指标的变化趋势来看,进一步分析可以看渠道来源的变化、落地页的跳出率。
2.这些访客从那里来,以及效果怎么样?
从哪来?查看GA上的流量获取的概览页:
Referral:引荐网站,如博客、联盟等等;如果推广网站靠谱,可以考虑合作。
Direct:直接进入网站;考虑公众号等转化
Organic Search:自然搜索;考虑做搜索优化
Paid Search:付费搜索
效果?看哪些页面跳出率高。
3.访客在网站上做了什么?
1-流量最大的着陆页:可以在GA“行为”模块的“着陆页”查看。
查看数据:找出流量最大的着陆页,着重优化,降低跳出率。
2-浏览最大的页面:可以在GA“行为”模块的“所有页面”查看。
查看数据:找出流量最大的页面,并与预期对比,发现差异;与流量最大的着陆页对比,就能发现访客浏览了哪些页面,从哪里退出。
3-页面点击热图:对用户点击了哪些链接进行分析,可以在GA"行为"模块的“网页内分析”查看。
查看数据:可以选择流量最大的几个页面进行分析;
4-主要流程的转化漏斗:可以在GA"行为"模块的“渠道可视化”定义转化漏斗。
查看数据:分析每一步骤的转化率,找出流失最多的步骤,重点优化。
APP类:
以云音乐为例,云音乐改版较大,因此七天出第一版数据,初步判断是否存在重大问题。若不存在,两周出一版进一步确认。
分析思路:
1.看新用户留存,前14天内新版本是否对新用户留存起到促进作用。从数据上看,整体增加了留存,初步判断不存在问题。
2.核心功能使用率,前14天内新增用户听歌比例。从数据上看,有提升,说明有利于引导用户播放歌曲。
3.新功能使用率和继续使用率(本周使用过功能的用户,下周继续使用功能的比例)。
4.对核心功能的促进效率(核心贡献的概念:使用过功能A的听歌人数比例-未使用过功能A的听歌人数比例)
UGC类:
1.有多少访客,访客有什么特征?
访客特征:访问时间段、在哪些地域访问、用什么设备、网络
2.访客从哪些渠道获取,效果怎么样?
基本思路:带来多少新访客、浏览深度、留存及转化率情况
WEB网站:新访客占比(代表渠道拓展用户的能力)、跳出率、浏览页面数、转化率。
移动应用:新设备占比、次日留存率、转化率
3.访客参与深度如何?
跳出率、浏览页面数、转化率、核心功能使用率
4.这些访客最终有没有转化,转化漏斗是否顺畅?
任何有意义的动作都可以认为是转化
最终目标:产出优质内容
转化漏斗:按功能先后顺序、按参与深度
顺序漏斗:入站UV、浏览商品详情页、提交订单、支付成功
参与深度漏斗:访客数、登录访客数、点赞评论、原创
六、数据分析方法
6.1方法纵览
一、初级数据分析方法索引
①对比分析(对比思路有——目标对比、不同时期对比、同级部门|单位|地区对比、行业内对比、活动效果 对比)
②分组分析法:总体中的数据根据性质做归类,不同类对比(如年龄组、性别组、学历组等
③结构分析法:就是某成分占总体的百分比和比率(很容易懂吧)
④平均值分析法:(没啥好说的)
⑤交叉分析法:通常用于分析两个变量之间的关系,【如:原数据(地区、水果类型、销量)→交叉分析后(某地区某水果的销售量)】
⑥综合评价分析:多个指标换成一个能够衡量的综合情况的指标(好比找找工作,你要求发展前景、薪资、工作环境等,但是面对10个公司做选择的时候,这些分散的指标并不能帮助你做决策,但如果发展前景60%,10个公司从0-1分别给分;薪资30%,10个公司从0-1分别给分;工作环境10%,10个公司从0-1分别给分,最后计算一个总分降序排列,是不是瞬间感觉决策变的简单了?)
⑦杜邦分析:涉及财务知识,百度吧~不过原理是找到一个综合指标,并依次往下找到其相关指标
⑧漏斗分析:漏斗分析(适用于网站中某些关键路径转化率的分析)+对比分析——不一样的效果
⑨矩阵关联分析(重点):百度,一句话说不清,不过感觉经济类很多模型都是这种类型的呀~书里提及的一个比较好的方法就是在矩阵的基础上加一个权重分析,可以是的数据更具体形象。。。。。建议看书
二、高级数据分析方法索引
①产品研究:相关分析、对应分析、判别分析、结合分析、多维尺度分析等;
②品牌研究:相关分析、聚类分析、判别分析、因子分析、对应分析、多维尺度分析等;
③价格研究:相关分析、PSM价格分析等
④市场细分:聚类分析、判别分析、因子分析、对应分析、多维尺度分析、logistic回归、决策树等
⑤满意度研究:相关分析、回归分析、主成分分析、因子分析、结构方程等
⑥用户研究:相关分析、聚类分析、判别分析、因子分析、对应分析、logistic回归、决策树、关联规则等
⑦预测决策:回归分析、决策树、神经网络、时间序列、logistic回归等
注:摘自简书作者 fishD 《数据分析方法索引》
原文链接:http://www.jianshu.com/p/b92d28092475
6.2常用数据分析方法
对比分析:横向对比-跟目标值比、跟上个月比;纵向对比-跟竞争对手比。
象限分析:通过两个维度划分四类。
交叉分析法:对数据在不同维度进行交叉展现,进行多角度的结合分析。交叉分析的主要作用是从多个维度细分数据,从中发现最为相关的维度来探索数据变化的原因。例如纵横结合对比,横向:月份;纵向:OS客户端、渠道。
6.3数据分析框架
常见分析框架:PEST-宏观环境、5W2H-万能、SWOT-战略分析、SMART-目标管理、4P理论-营销。
互联网分析常用框架-AARRR(转化率漏斗)
漏斗分析法除了AARRR,也可以用功能漏斗,即按产品主要功能流程进行漏斗分析。转化率可以对比-与上月、行业均值对比。
Acquisition(获取)Activation(激活) Retention(留存) Revenue(收入) Refer(推荐)
获取:产品运营基础,用户从哪里来的。
指标:曝光数、点击数、打开率、下载量、安装量、用户获取成本
激活:用户开始使用产品。
指标:设备激活量,新注册用户数、订阅数量、事件达成数、浏览数、日活跃率
留存:体验过产品后,如何让用户持续使用。
指标:次日留存率、7日留存率、距离上次使用时长、DAU/MAU、7日回访率
收入:关键阶段,引入用户贡献多少价值。
指标:付费率、付费频次、客单价、用户价值
推荐:推荐他人使用产品。
指标:转发数、邀请数、评论数、K因子
6.4通过逻辑拆解细化指标
逻辑拆解,即寻找跟核心指标有逻辑关系的相关指标。
原则:找到的指标一定是能够影响核心指标变动,他们之间对应要存在强烈的逻辑关联,选用这些相关指标之前,我们必须清楚的了解他们是如何影响核心指标的。当核心指标发生了变动,我们一般会去看跟核心指标最为相关的指标变动从而定位其原因。
分层拆解(逻辑拆解后):
第一层:直接解释核心指标、变动的大的方向
第二层:针对这个大方向的细分,从而能够将问题定位的更加准确和可操作性。
原则:同一层里面的各个相关指标都是代表了一个寻找的方向,所以他们之间不能有相关性。
案例:销售额=UV*转化率*客单价(逻辑拆解,看三个指标的变化)然后进行分层拆解:如UV-细分流量相关的指标-推广来源流量、新老访客,还可以第三层,直到定位到原因。
存在的问题:拆解指标时不能保证与核心指标相关的所有信息都能找到。
遗漏指标:建议多找几个人头脑风暴,在其他的方向和因素中找出来。
七、写在最后
写得有点乱诶,不过数据分析很多文章、书籍都有写,但更重要的果然是实践环节,平时多练练,做不到的话可以多想想平时用的产品应该分析哪些指标,指标的预期是多少,如何改进...
tips:大家还可以找找数据需求文档,看看别人是如何提出数据需求的。
心法层面:
好奇心、求知欲、宽广的心怀、敢于打破常规、热爱生活享受生活
通过正向反馈去培养能力
基础层面:
核心基础概念:PV、UV、跳出率、转化率、访问数、点击数等
基本统计原理:cookie、访问请求、日志等
如何结合工具:
1.数据驱动产品的思维方式
2.对业务逻辑做足够的了解-了解底层、系统调用-从底层业务出发提取关键数据
3.日常中重视数据保持敏感,关注数据活用数据