温故知新:
在昨天,我们学习了使用seaborn.lmplot()
来绘制回归图,用来表示变量之间的线性关系。它主要是在散点图的基础上,绘制了一条直线,而这条直线(也可以是曲线)则表明了模型预测的变量之间的关系。忘记的同学可以回去再看一遍。
今天,我们的目标是从一个小案例中学习以下几点:
- 调色板
- 条形图
- 图形矩阵(多子图)
条形图矩阵
老规矩,我们先看代码和效果,然后再详解每一个细节。
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
sns.set(style="white", context="talk")
rs = np.random.RandomState(8)
# 设置matplotlib图形和坐标轴对象
f, (ax1, ax2, ax3) = plt.subplots(3, 1, figsize=(7, 5), sharex=True)
# 生成一些序列数据
x = np.array(list("ABCDEFGHIJ"))
y1 = np.arange(1, 11)
sns.barplot(x=x, y=y1, palette="rocket", ax=ax1)
ax1.axhline(0, color="k", clip_on=False)
ax1.set_ylabel("Sequential")
# 让数据围绕着0点发散
y2 = y1 - 5.5
sns.barplot(x=x, y=y2, palette="vlag", ax=ax2)
ax2.axhline(0, color="k", clip_on=False)
ax2.set_ylabel("Diverging")
# 随机调整数据的顺序,构造定性数据
y3 = rs.choice(y1, len(y1), replace=False)
sns.barplot(x=x, y=y3, palette="deep", ax=ax3)
ax3.axhline(0, color="k", clip_on=False)
ax3.set_ylabel("Qualitative")
# 调整图形细节
sns.despine(bottom=True)
plt.setp(f.axes, yticks=[])
plt.tight_layout(h_pad=2)
可以看到,我们实现了一个3 * 1
的图形矩阵,每个子图由一幅条形图占据,且他们被我们分别指定了不同的色彩组合。
那么接下来,我们就来看一下它们是如何一步步实现的吧!
- 第一步,我们导入了必要的库
numpy
、seaborn
、matplotlib.pyplot
;设置seaborn
的主题为white
,设置背景风格为talk
(这里不熟悉的同学可以去看我之前讲解Seaborn的文章中“让图形更美观”那一篇);然后使用numpy的随机工具设置了一个随机种子,在同样的随机种子下,可以保证大家生成的数据和这里的一致;
- 第二步,我们用
plt.subplots()
生成了一个整体大小为(7,5)的图形对象,同时我们将它分割为三行一列的三张子图,并且设置它们共享同一个X轴。plt.subplots()
对象在生成后会返回两个数据,第一个是这个图形对象,即figure
对象;第二个则是以元组的方式返回所有的坐标轴对象axes
,在这里有三个坐标轴对象,我们直接将其解析了出来。我们也可以使用fig, axes = plt.subplots(...)
,然后通过axes[0]、axes[1]
这样的方式去调用每个坐标轴对象;
第三步,我们先将
A-J
这样一串字符转换成numpy
数组,作为x
轴对应的分类数据;然后我们用numpy.arange(1, 11)
生成一组整数数组,arange
与range()
类似,区别在于前者生成一个numpy
数组,后者生成一个迭代器,需要使用list(range(1, 11))
或者使用tuple
等将其转化成序列类数据;然后我们用sns.barplot()
在ax1
坐标轴上绘制了一个条形图,并且指定调色板为rocket
,这是一个用于表现连续数据的调色板,他们色调一致,但是会根据数值的大小调整色彩的亮度和饱和度。我们用x / y
参数指定了横坐标和纵坐标的数据;然后我们使用坐标轴对象的axhline()
函数添加了一条纵坐标为0的水平参考线,并设置y轴标签为“Sequential”(这里不熟悉的可以去看我的从零开始学Python可视化系列的第一篇文章);第四步,我们将y轴数据调整为发散型(可以理解为围绕0点向两边发散的数据,事实上这里主要是对应了发散型的调色板,即正负值各对应一个色调,然后根据绝对值的大小调整亮度和饱和度);然后我们使用同样的方式在
ax2
上绘制了条形图,并设置了调色板为vlag
;然后我们添加了参考线,设置纵轴标签为“Diverging”;第五步,我们使用刚才的随机对象将数据随机排了顺序,假装它们是一组定性数据(分类数据),然后用了一组分类(色调不同)的调色板,并将图形绘制在
ax3
,添加了参考线,设置总轴标签为“Qualitative”;第六步,我们用
sns.despine(bottom=True)
去掉了上、右和下边界。注意,这里despine()
函数默认会去除上方和右侧的边界,如果想要去掉左边和下方的边界,就需要额外指定left=True, bottom=True
;然后用plt.setp(f.axes, yticks=[])
去除了所有的纵轴刻度尺,这里用plt.setp()
是控制的整个图的属性,而非某个坐标轴的属性,然后我们指认了图中所有的坐标轴(通过f.axes
)作为调整对象,并将他们的刻度设置为空列表;最后我们用plt.tight_layout()
函数设置了每行坐标轴(子图)之间的间隔(用w_pad
即可设置每列子图之间的间隔)。
好了,我们在今天尝试了条形图、调色板、子图(矩阵图)、参考线等知识点的使用,你学会了吗?