快马加鞭,今天复习的第二章!变量集中趋势与离散趋势的刻画!
集中趋势小结
- 三种如何找到集中值的思路:
① 最多的频次--> 众值 <--定类、定序、定距/比
② 居中--> 中位值 <--定序、定距/比
③ 平均--> 均值 <--定距/比 - 对数据的利用程度不同:
众值:频次
中位值:频次、变量值排序
均值:频次、变量值排序、变量值大小
注:均值不一定代表大多数情况,也不一定是最正常的情况。比如上世纪五十年代房产商,根据现有购房需求的平均值,建造了很多2个卧室的房子,但其实很多家庭需要的是1个或者3个卧室的房子。
离散趋势小结
- 集中趋势和离散趋势是一个变量分布 互补 的两面,前者提供了数据的代表值,有助于估计或预测;后者提供了数据的变异程度,能反映估计或预测所犯的错误。
- 与集中趋势类似,离散趋势指标的选择也同样取决于变量的 测量层次 。
定类变量 | 定序变量 | 定距变量 |
---|---|---|
集中趋势 | 众值 中位值 | 均值 |
离散趋势 | 异众比率 四分互差 | 方差或标准差 极差 |
公式总结:
众值:
异众比率:
中位数:
四分互差:
均值:
总体方差:
总体标准差:
样本方差:
样本标准差:
思维导图
3.23 填坑~