极差又叫做全距
上届 下届 下四分位数 中位数 上四分位数
避免距离异常值的做法:四分位距= 上四分位 - 下四分位 (确定位置是个数除以4再进一,n/4*3再round up 一位 )
百分位数 百分位距
箱线图
方差 标准差
方差速算法 = (sum x^2) / n - μ^2
处理样本时是n-1 不是 n
对于不同的数据集,均值和标准分都不相同时:
用标准分来比较。标准分是Z.
Z = (x - μ) / sigma z分越高越好
标准分z implies that μ = 0, sigma = 1.
- 某一种对异常值的定义是:偏离均值三个标准差的点