1. 何为数据分析及数据分析的作用
1. 1数据分析的类别
1.1.1 描述性数据分析(初级数据分析)
- 对比分析法
- 平均分析法
- 交叉分析法等
1.1.2 探索性数据分析(高级数据分析)
- 相关分析
- 因子分析
- 回归分析
1.1.3 验证性数据分析(高级数据分析)
- 相关分析
- 因子分析
- 回归分析
1.2 数据分析的作用
- 现状分析
- 原因分析
- 预测分析
2. 数据分析六步曲
2.1 明确分析目的和思路
分析理论模型:
** 营销方面的理论模型**
- 4P
- 用户使用行为
- STP理论
- SWOT理论等
** 管理方面的理论模型**
- PEST
- 5W2H
- 时间管理
- 生命周期
- 逻辑树
- SMART原则等
2.2 数据收集
数据来源:
- 数据库
- 公开出版物
<<中国统计年鉴>> <<中国社会统计年鉴>> <<中国人口统计年鉴>> <<世界经济年鉴>> <<世界发展报告>> - 互联网
国家或地方统计局网站,行业组织网站,政府机构网站,传播媒体网站,大型综合门户网站等 - 市场调查
2.3 数据处理
- 数据清洗
- 数据转化
- 数据提取
- 数据计算
2.4 数据分析
- 数据分析与数据处理的关系
数据处理是数据分析的基础,是将收集到的数据转换为可以分析的形式,保证数据的一致性和有效性 - 数据分析与数据挖掘的关系
数据挖掘是一种高级的数据分析方法,从大量的数据中挖掘出有用的信息,侧重解决四类数据分析问题:分类\聚类\关联\预测
2.5 数据展现
- 初步加工
饼图\柱形图\条形图\拆线图\散点图\雷达图 - 进一步加工
金字塔图\矩阵图\漏斗图\帕雷托图
2.6 报告撰写
- 分析报告要有一个好的分析框架,并且图文并茂,层次明晰
- 分析报告要有明确的结论
- 分析报告要有建议或解决方案
3. 数据分析的三大误区
- 分析目的不明确,为分析而分析
- 缺乏业务知识,分析结果偏离实际
- 一味追求使用高级分析方法,热衷研究模型
4. 数据分析师的职业要求
- 懂业务
要懂行业知识和业务流程,有自己独到的见解 - 懂管理
- 懂分析
要掌握数据分析的基础原理和分析方法- 基本分析方法
对比分析法\分组分析法\交叉分析法\结构分析法\漏斗图分析法\综合评价分析法\因素分析法\矩阵关联分析法等 - 高级分析方法
相关分析法\回归分析法\聚类分析法\判别分析法\主成份分析法\因子分析法\对应分析法\时间序列等
- 基本分析方法
- 懂工具
EXCEL\Access\SPASS\SAS等 - 懂设计
图形的选择\版式的设计\颜色搭等
5. 数据分析常用指标及术语
- 平均数
算术平均数\调和平均数\几何平均数等 - 绝对数与相对数
从业务角度来看,绝对数就是数量(Quantity),相对数就是质量(Quality),进行数据分析时,可能从两个角度分析,简称QQ模型.例如,先分析业务是否达到一定的规模?如果规模够大,再分析质量高不高,质量不高就可以从提高质量角度入手.收入与利润率,用户数与渗透率等结合分析,都是QQ模型的经典应用.- 绝对数
如:5000万人,10000亿元,300米,500家等 - 相对数
如:20%,7成,6倍,1:5,1200元/人等
-百分比与百分点 - 百分比
百分比是相对数中的一种,表示一个数是另一个数的百分之几,也称百分数或百分率.如8% - 百分点
百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%,如今年公司利润率是45%,比去年的28%提高了17个百分点.
- 绝对数
- 频数与频率
- 频数
频数是绝对数
,指一组数据中个别数据重复出现的次数,比如一个班有50人,男生30人,男生的频数为30 - 频率
频率是相对数
,指某类别在总体中出现的频繁程度,如上,30名男生在班上50人中出现的频率为60%
- 频数
- 比例与比率
比例和比率均是相对数
- 比例
比例是指在总体中各部分数值占全部数值的比重,通常反映总体的构成和结构
.比如30名男生在班上50人中所占的比例(比重)为60% - 比率
比率是指不同类别数值的对比,反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系
.比如50人的班级,男生30人,则男生与女生的比率为30:20
- 比例
- 倍数与番数
位数与番数都属于相对数
- 倍数
倍数是一个数除以另一个数所得的商
;倍数一般表示数值的增长或上升幅度,而不适用于表示数值的减少或下降 - 番数
番数是指一个数是原来数值的2的N次方倍
对比表述示例:公司今年产品销量番了一番(6.4=3.2*2^1),从去年的3.2万件提高到今年的6.4万件;此外,公司成本控制得很好,由20万元下降了50%,今年成本 为10万元.
- 倍数
- 同比与环比
- 同比
同比是指与历史同期进行比较
得到的数值,反映的是事物发展的相对情况,比如今年2月与去年2月相比 - 环比
环比是指与前一个统计期进行比较
得到的数值,反映的是事物逐期发展的情况,比如今年2月与今年1月相比
- 同比
6.数据分析三字经
- 学习:
先了解,后深入;先记录,后记忆;先理论,后实践;先模仿,后创新 - 方法:
先思路,后方法;先框架,后细化;先方法,后工具;先思考,后动手 - 分析:
先业务,后数据;先假设,后验证;先总体,后局部;先总结,后建议