统计学大体的分类。
1.描述性统计:
假设有一大堆数据,却希望在不告诉别人所有数据的情况下,可以找一些指示性的数据来代表所有数据,而无需将所有数据都说一次。
2.推断性统计:
运用数据来对实物做结论, 假设从总体得到一些样本,从分析这些样本而推断出总体。
集中趋势
集中趋势是属于描述性统计,也就是一组数据中最具有代表性的数据,一般包括算术平均数(均值)、中位数、众数。
均值(算术平均数):
所有数据之和除以数据的个数即为平均数
中位数
奇数时,排在最中间的数就是中位数;
偶数时,排在中间的两个数的算术平均数即为中位数。
众数
一组数据中出现频率最高的数即为众数;
如果一组数据中出现两个相同频率的众数,那么这叫双众数;
如果一组数据中出现两个以上相同频率的众数,即为多众数;
双众数和多众数会使数据模糊,所以一般不采用双众数或多众数来查看集中趋势。
离群值
与其它数很不一样的数(比如特别大或者特别小),有此数时,中位数和众数比算术平均数更能体现该组数的集中趋势。
有了平均数为什么还要中位数和众数啦?
这三种计算方式都是为了看一组数据集中在那个数据的周围(也就是集中趋势的概念),因为平均数会受到一组数据中的太大或者太小的数据(离群值)的影响,而中位数和众数则不会受到影响。