一、箱型图
1、是一种用作显示一组连续数据分散情况资料的统计图,因形状如箱子而得名。
2、它主要用于反映原始数据分布的特征,常可以进行按类分组的多组数据分布特征的比 较。
3、箱线图的绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数;然后, 连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间。箱须为四分位+或-1.5倍四分位。箱须外为离群值。
二、matplotlib实现
import pandas as pd
import matplotlib.pyplot as plt
path = 'train.csv'
data= pd.read_csv(path,sep=',')
data.boxplot(column='ApplicantIncome',by='Education')
plt.show()
三、参数说明
column为dataframe数据的数据列
by为dataframe数据的分组列