一、目录:
分布图
- displot (直方图)
- kedplot(概率密度图)
- jointplot(联合密度图)
- pairplot(多变量图)
分类图
- boxplot(箱线图)
- violinplot(提琴图)
回归图
- lmplot (回归图)
矩阵图
- heatmap (热力图)
二、回归图:
lmplot()是一个衡量变量之间关系的图形,他会在绘制二维散点图时,自动完成回归拟合
seaborn.lmplot(x, y, data, hue=None, col=None, row=None, palette=None,
col_wrap=None, height=5, aspect=1, markers='o', sharex=True, sharey=True,
hue_order=None, col_order=None, row_order=None, legend=True, legend_out=True,
x_estimator=None, x_bins=None, x_ci='ci', scatter=True, fit_reg=True, ci=95,
n_boot=1000, units=None, order=1, logistic=False, lowess=False, robust=False,
logx=False, x_partial=None, y_partial=None, truncate=False, x_jitter=None,
y_jitter=None, scatter_kws=None, line_kws=None, size=None)
- col,row:根据所指定的属性,在行、列上进行分类(指在整个画图面板上)
- col_wrap:指定每行的列数,最多等于col参数所对应的不同类别的数量
- aspect:控制图的长宽比
- order:多项式回归,控制进行回归曲线的幂次,设定指数,可以用多项式拟合。(指的是回归曲线的用一次函数拟合还是二次函数等拟合数据,这个拟合并不是完全精确的,只是粗略的一个给出一个数据之间关系的直观表示)
- logistic:逻辑回归
- ci:置信区间
- robust:如果是True,使用statsmodels来估计一个稳健的回归(鲁棒线性模型)。这将减少异常值。请注意 logistic回归和robust回归相较于简单线性回归需要更大的计算量,其置信区间的产生也依赖于bootstrap采样,你可以关掉置信区间估计来提高速度(ci=None);
- 转换为log(x)
三、总结:
seaborn中还有其他的非常好用的统计图形可以使用,还可以通过sns.set_style()设置全局参数。在具体使用中,最好是结合matplotlib一起使用,用图形更好的表达数据,理解数据,用图形来表达数据观点,不要局限在画出复杂精美的图像中。