书名:谁说菜鸟不会数据分析(入门篇)
作者:刘夏璐,狄松
本书主要还是进行数据分析入门相关知识的分享,主要软件为Excel。里面整理一些自己觉得重要的知识点提醒,需要的可以找下原书详细看。因为内容还是比较多的,于是分几篇完成整理吧。
一、数据分析基础
数据分析的目的是把复杂数据背后的信息集中与提炼。分为:
描述性数据分析
探索性数据分析
验证性数据分析
数据分析作用:
现状分析
原因分析
预测分析
数据分析过程六个阶段:
明确分析目的和思路
数据收集
数据处理
数据分析
数据展现
报告撰写
数据来源:
数据库
公开出版物(统计年鉴或报告)
互联网
市场调查
常用指标和术语:
平均数:数据平均值
绝对数:反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,也可表现为一定时间、地点条件下数量增减变化的绝对数。
相对数:两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度,基本公式:相对数=比较数值(比数)/基础数值(基数)
百分比:相对数的一种,一个数是另一个数的百分之几。
百分点:不同时期以百分数的形式表示的相对指标的变动幅度,即不应该说提高了17%而应该说提高了17个百分点。
频数:一组数据中个别数据重复出现的次数。
频率;每组类别次数与总次数的比值。
比例:属于相对数,在总体中各部分的数值占全部数值的比重。
比率:属于相对数,不同类别数值的对比。
同比:与历史同时期进行比较得到的数值。
环比:与前一个统计期进行比较得到的数值。
二、确定分析思路
数据分析方法论:从宏观角度指导如何进行数据分析。
数据分析法:具体的分析方法。
常用数据分析方法论:
1、PEST分析法
Political Economic Technological Social
2、5W2H分析法
Why What Who When Where How How much
3、逻辑树分析法
已知问题作为树干,相关问题作为树枝,将问题的所有子问题分层罗列。
遵循以下三个原则:
要素化:把相同问题总结归纳成要素。
框架化:将各个要素组织成框架,遵守不重不漏的原则。
关联化:框架内的各要素保持必要的相互关系,简单而不孤立。
4、4P营销理论
Product Price Place(渠道)Promotion(促销)
5、用户行为理论
认知、熟悉、试用、使用、忠诚
以网站分析为例:
认知——网站访问——IP、PV、人均页面访问量、访问来源
熟悉——网站浏览——平均停留时长、跳出率、页面偏好
熟悉——站内搜索——搜索访问次数占比
试用——用户注册——注册用户数、注册转化率
使用——用户登录——登录用户数、人均登录、访问登录比
使用——用户订购——订购量、订购频次、内容、转化率
忠诚——用户黏性——回访者比率、访问深度
忠诚——用户流失——用户流失数、流失率
三、数据准备
字段是事物或现象的某种特征,统计学中称为变量。
记录是事物或现象某种特征的具体表现,称为数据或变量值。
四、数据处理
数据清洗,将多余的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或删除。
数据加工,对数据字段进行信息提取、计算、分组、转换等加工。
COUNTIF函数
Ctrl+Enter 在不连续的区域中同时输入同一个数据或公式
Ctrl+F 查找
Ctrl+H 替换
Ctrl+G 定位
以上内容为个人理解整理学习用,请在引用时标明原作者。
如果觉得我的努力还可以,客官点个赞可好?
如果有理解错误,请评论指点我修改。你的支持也是我的学习动力。谢谢!