一、平均值
1.平均数
设n个数为这n个数的平均数。
计算技巧:把所有数字减去一个数,算出平均值,平均值再加上一开始减去的这个数
2.众数
在一组数据中,出现次数最多的数据叫作这组数据的众数
众数不存在:每个数字出现的次数相同
众数可能不唯一:出现次数相同
3.中位数
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.
- 共有2n+1个,中位数为第n+1个数字
- 共有2n个,中位数为第n个和第n+1个平均值
二、方差
1.极差
极差二最大值-最小值
意义:
- 极差是用来反映一组数据变化范围的大小.我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围,用这种方法得到的差就称为极差.
- 极差仅表示一组数据变化范围的大小,只对极端值较为敏感,而不能表示其他更多的意义
2.方差
基本公式:
方差:
扩展公式:
平方和的平均值-平均值的平方
意义:
方差是反映一组数据的整体波动大小的指标,它是指一组数据中各数据与这组数据的平均数的差的平方的平均数,它反映的是一组数据偏离平均值的情况
3.方差
定义
在计算方差的过程中,可以看出方差的数量单位与原数据的数量单位不一致,因而在实际应用时常常将求出的方差再开平方,这就是标准差.标准差为
意义
方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.
方差较大的波动较大,方差较小的波动较小,
方差的单位是原数据的单位平方,标准差的单位与原数据的单位相同.
在解决实际问题时,常用样本的方差来估计总体的方差去考查总体的波动情况.
原数据变化对应的平均值和方差的变化
原数据: ,平均值,方差
, 平均值,方差不变
平均值,方差
, 平均值,方差
- 连续五个整数,平均值为中位数,方差为2
- 所有数据都相等,方差为0,无波动性
- 数据越集中,方差越小,波动越稳定
- 数据越分散,方差越大,波动越不稳定
三、图表
1.饼图
饼图是一个划分为几个扇形的圆形统计图表,用于描述量、频率或百分比之间的相对关系.
在饼图中,每个扇区的弧长(以及圆心角和面积)大小为其所表示的数量的比例.
这些扇区合在一起刚好是一个完全的圆形.顾名思义,这些扇区拼成了十个切开的饼形图案.
其所用公式为:某部分所占的百分比等于对应扇形所占整个圆周的比例
2.柱状图
柱状图是一种以长方形的长度为变量的表达图形的统计报告图,它由一系列高度不等的纵向条纹表示数据分布的情况,用来比较两个或以上的数值(不同时间或者不同条件),它只有一个变量,通常利用于较小的数据集分析.柱状图亦可横向排列,或用多维方式表达
3.直方图
定义
把数据分为若干个小组,每组的组距保持一致,并在直角坐标系的横轴上标出每组的位置(以组距作为底),计算每组所包含的数据个数(频数),以该组的“频率/组距”为高作矩形,这样得出若干个矩形构成的图叫作直方图.
计算
- 组距的确定:一般是人为确定,不能太大也不能太小.
- 组数的确定:组数=
- 每组频率的确定:频率=
- 每组所确定的矩形的面积=
- 频率直方图下的总面积等于1 (各个矩形面积之和等于1).
- 分组时要遵循“不重不漏”的原则:
“不重”是指某一个数据只能分在其中的某一组,不能在其他组中出现;
“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏
关系式
在直方图中,
众数是最高矩形底边中点的横坐标;
中位数左边和右边的直方图的面积相等;
平均数是直方图的重心,它等于每个小矩形的面积乘以小矩形底边中点横坐标之和.