引入方差和标准差,主要是为了更加精确地度量数据的变异性,也就是集中程度,由于它们使用了数据集中的每个数据,因此更加全面。
各个数值与均值的距离正负相抵。
方差
方差是量度数据分散性的一种方法,是数值与均值的距离的平方数的平均值。
标准差
为了更加的体现数值与均值的距离,来确认分散性,提出了标准差。
标准差是方差的平方根。
标准分z
标准分的作用是将几个数据集转换成一个理论上的新分布,这个分布的均值为0,标准差为1,这是一种可用于进行比较的通用分布。其实就是将不同的数据集通过这种转化,放到同一组数据集中,从而达到比较的目的。
标准分可以取任意值,这些值表示相对于均值的位置。正的z分表示数值高于均值,负的z分表示数值低于均值。数值的大小体现了数值与均值的距离。