- 一个长方形箱子,下面的边表示分布的第25个百分位数,上面的边表示分布的第75个百分位数,上下两边的距离称为四分位距。箱子的中部有一条横线,表示分布的中位数,也就是分布的第50个百分位数。这三条线可以表示分布的分散情况,还可以帮助我们明确数据是关于中位数对称的,还是偏向某一侧。
- 圆点表示落在箱子上下两边1.5倍四分位距外的观测,这些离群点就是异常值,因此需要单独绘出。
- 从箱子上下两边延伸出的直线( 或称为须)可以到达分布中最远的非离群点处。
该描述出自《R数据科学》(一本非常值得一看的 R 入门书籍)