描述性统计分析
1) 侧重于对数据的描述(数据的特征),如:数据的平均水平、数据可行范围、数据的波动分散程度
2) 帮助数据分析人员掌握和理解数据
3) 描述性统计分析_作用:
① 数据的频数分析:利用频数分析和交叉频数分析可以检验异常值
② 数据的集中趋势分析(均值、中位数、众数等):用来反映数据的一般水平
③ 数据离散程度分析(标准差、极差、变异系数等):用来反映数据之间的差异程度
④ 数据分布(偏度值、峰度值等):检查样本数据是否符合正态分布
⑤ 基本统计图形(饼图、直方图、箱线图等):用图形表达数据
4) 描述性统计的指标解释
平均值:一组数据之和除以数据的个数
标准误差:标准差除以样本容量的开平方来计算
中位数:排序后位于中间的数据的值
众数:出现次数最多的值
标准差:各个数据分别与其平均数之差的平方的和的平均数的平方根;反映数据离散程序最常用的量化形式,是表示精确度的重要指标
方差:各个数据分别与其平均数之差的平方的和的平均数
峰值:衡量数据分布起伏变化的指标
偏度:衡量数据峰值偏移的指数
区域:最大值与最小值的差值
最小值:一组数据中的值最小的数据
最大值:一组数据中的值最大的数据
求和:一组数据中所有数据的和
观测数:一组数据中所有数据的个数
第K大(小)值:输出表的某一行中包含每个数据区域的第K个最大(小)值
置信度:总体均值区间估计的置信度
探索性统计分析
1) 发现数据背后隐藏的内在规律和联系、挖掘数据异常原因、了解数据不易发现的内在价值和联系
2) 一般是借助数据可视化技术将问题的答案图形化呈现
推断性统计分析
侧重于寻找定量的答案