之前文章,讨论过数据分析方法论,以及其和数据分析法的区别,但并未对数据分析法做进一步的讨论,本文就做个补充。
先说数据分析有三大作用,分别是现状分析、原因分析和预测分析,其对应的基本方法分别是对比、细分和预测,每个方法下又可细分出好多的数据分析法。本文主要讲的内容是对比和细分两大方法。
数据分析方法:
对比分析法:
- 定义:指两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。
- 特点:非常直观地看出事物某方面的变化或差异,并且可以准确量化地表示出这种变化或差距是多少。
- 分类:
- 静态比较:在同一时期对不同主体的指标进行比较,比如不同部门、地区、国家,也叫横向比较。
- 动态比较:对同一主体在不同时期的指标进行比较,也叫纵向比较。
- 实践运用:目前对比分析常用的有以下几个维度
- 与目标对比
- 不同时期对比
- 同级部门、单位、地区对比
- 行业内对比
- 活动效果对比
分组分析法:
- 定义:根据数据分析对象的特征,按照一定的指标,把数据分析对象划分为不同的部分和类型进行研究,以揭示其内在联系和规律性。
- 特点:分组的目的是为了便于对比,把总体中具有不同性质的对象区分开,性质相同的对象合并在一起,以便解构内在的数量关系,因此分组法必须和对比法结合运用。
- 分类:
- 等距分组:各单位数据变动比较均匀的情况下,比较适合等距分组。
- 不等距分组:各单位数据变动很不均匀的情况下,比较适合不等距分组。
- 组距分组:组数由数据分析师根据数据本身特点确定,组距=(最大值-最小值)/组数。
结构分析法:
- 定义:被分析总体内的各部分与总体之间进行对比的分析方法,即总体内各部分占总体的比例,属于相对指标。
- 特点:一般某部分的比例越大,说明其中要程度越高,对总体的影响越大。
- 公式:结构相对指标(比例)=(总体某部分的数值 / 总体总量)*100%。
- 应用:市场占有率=(某种商品销售量 / 该种商品市场销售总量)*100%。
平均分析法:
- 定义:运用计算平均数的方法来反应总体在一定时间、地点条件下某一数量特征的一般水平。
- 特点:
- 利用平均指标对比同类现象在不同地区、不同行业、不同类型单位等之间的差异程度,比用总量指标对比更有说服力。
- 利用平均指标对比某些现象在不同时期的变化,更能说明其发展趋势和规律。
- 分类:算术平均数、调和平均数、几何平均数、众数和中位数等,其中最为常用的是算术平均数,也就是日常所说的平均数或平均值。
- 公式:算术平均数=总体各单位数值的总和 / 总体单位个数。
交叉分析法:
- 定义:通常用于分析两个变量(字段)之间的关系,即同时将两个有一定联系的变量及其值交叉排列在一张表格内,使个变量值成为不同变量的交叉节点,形成交叉表,从而分析交叉表中变量之间的关系。
- 示例:
综合评价分析法:
- 定义:运用多个指标对对个参评单位进行评价的方法,也称为多变量综合评价分析法。即将多个指标转化为一个能够反应综合情况的指标来进行分析评价,比如不同国家的经济实力,不同地区的社会发展水平等。
- 步骤:
- 确定综合评价体系,即包含哪些指标,是综合评价的基础和依据;
- 收集数据,并对不同计量单位的指标数据进行标准化处理;
- 确定指标体系中各指标的权重,以保证评价的科学性;
- 对经处理后的指标再进行汇总,计算出综合评价指数或总和评价分值;
- 根据评价指数或分值对参评单位进行排序,并由此得出结论。
- 特点:
- 评价过程不是逐个指标顺次完成的,而是通过一些特殊方法将多个指标的评价同时进行;
- 在综合评价过程中,一般要根据指标的重要性进行加权处理;
- 评价结果不再是具有具体含义的统计指标,而以指数或分值表示参评单位综合状况的排序。
- 数据的标准化:将数据按比例缩放,使之落入一个小的特定区间,去除数据单位的限制,转换为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。最典型的就是0-1标准化和Z标准化。
- 0-1标准化:对原始数据做线性变化,使结果落到[0,1]区间。第N个标准化处理的值=(第N个原始值 - 最小值)/(最大值 - 最小值)。
- Z标准化:也称为标准差标准化,经过处理的数据符合标准正态分布。第N个标准化处理的值=(第N个原始值 - 平均值)/ 标准差。
- 权重确定方法:
- 分类:专家访谈法、德尔菲法、层次分析法、主成分分析法、因子分析法、归因分析法、目标优化矩阵表法。
- 目标优化矩阵表:将人脑的模糊思维,简化为计算机的1、0式逻辑思维,最后得出量化的结果。可以找几个有经验或专业的人士,通过他们的投票表决确定各项的重要性,从而获知各项目的权重数值。
- 目标优化矩阵表使用方法:将同样的因素行列分布,将纵轴项目依次和横轴上的项目对比,纵轴项目比横轴重要则填写1,否则填写0,完整填写好后,汇总得分得到权重,对于可能出现0值情况,可在评分基础上都加1处理,得到修正后的占比。
杜邦分析法:
- 定义:美国杜邦公司创造并最先采用的一种综合分析方法,又称杜邦财务分析体系,简称杜邦体系。它是利用各主要财务指标间的内在联系,对企业财务状况及经济效益进行综合分析评价的方法。
-
特点:将若干个用以评价企业经营效率和财务状况的比率按其内在联系有机结合起来,形成一个完整的指标体系,并最终通过权益收益率来综合反应。
漏斗图分析法:
- 定义:以漏斗图形式展现业务流程各个环节转化率的分析过程和结果。
- 使用范围:适用业务流程比较规范、周期比较长、各流程环节涉及复杂业务过程比较多的管理分析工具。
矩阵关联分析法:
- 定义:根据事物(如产品、服务等)的两个重要属性(指标)作为分析依据,进行分类关联分析,找出解决问题的一种分析方法。
- 使用方法:以属性A为横轴,属性B为纵轴,组成一个坐标系,在两坐标轴上分别按某一标准(可取平均值、经验值、行业水平等)进行刻度划分,构成四象限,将要分析的每个事物投射至这四个现象内,进行交叉分类分析,直观地将两个属性的关联性表现出来,因此也称为象限图分析法。
- 作用:矩阵关联分析法在解决问题和资源分配时,为决策者提供重要参考依据。先解决主要矛盾,再解决次要矛盾,有利于提高工作效率,将资源分配到最能产生绩效的部门、工作中,有利于决策者对资源优化配置。
- 分类:在矩阵基础上,还衍生出了表现数据变化的发展矩阵,改进难易矩阵等。
高级数据分析方法:
数据分析工具(数据透视表):
- 数据透视表操作很简单,这里主要总结下技巧
- 百分比计算:在数据透视表的数据项上,鼠标右击,选择”值显示方式“ - ”列汇总的百分比“可以得到该项数据占总体数据的百分比。
- 同比、环比计算:和”百分比计算“方式类似,在”值显示方式“对话框中选择”差异百分比“,”基本项“选择”上一个“可得到环比数据。
- 数据分组统计:在数据透视表的日期上,鼠标右击,选择”创建组“,在弹出的”分组“对话框中,确认起始日期,选择步长”月“或者其他单位,点击”确定“即可。
- 计算字段:可以在数据透视表的基础上,添加自定义的计算字段。在”分析“选项卡下的”字段、项目和集“找到,填写字段名称和公式即可生成。
- 计算项:计算项和计算字段类似,只不过计算字段计算的按行计算,计算项按列计算。
- 切片器:在”插入“ - ”筛选器“下有切片器,可以对表格和数据透视表数据进行快速筛选。
数据分析方法和工具很多,关键要明确问题,挑选最合适的分析方法工具。切莫为了让自己的数据分析显得逼格高,而用一些没必要的分析方法,浪费时间不讲,最怕最后还没分析个所以然。方法论和工具是好东西,但知道和熟练运用是两个概念,多实践多思考,与君共勉。
本文为《谁说菜鸟不会数据分析-入门篇》第五章读书笔记