填充曲线可以在前面plot绘制的曲线的基础上填充这些不同曲线之间的差异, 可以更直观的看出差异。
数据集
源码:
# coding=utf-8
import pandas as pd
from matplotlib import pyplot as plt
# 利用pandas库高效率读取csv格式的数据, 返回的data是一个类似于python字典的对象
data = pd.read_csv('data_2.csv')
# 取出data里面各个键下的所有值, 返回值是pandas.core.series.Series: 可迭代对象
ages = data['Age']
dev_salaries = data['All_Devs']
py_salaries = data['Python']
js_salaries = data['JavaScript']
plt.xkcd()
# 要绘制能填充空间的曲线,得先绘制出填充边缘的曲线(更直观), 第一条曲线使用虚线绘制, 颜色是黑色
plt.plot(ages, dev_salaries, color='#444444',
linestyle='--', label='All Devs')
plt.plot(ages, py_salaries, label='Python')
'''
# 设置水平方向上的填充阈值
overall_median = 57287
plt.fill_between(ages, py_salaries, overall_median,
where=(py_salaries > overall_median), interpolate=True,)
'''
# fill_between: fill_between(x, y1, y2=0, where=None, interpolate=False, step=None, *, data=None, **kwargs)
# 利用plt模块的fill_between方法可以绘制出填充区域, where参数接受一个bool对象, 表示在哪些地方填充(bool为True的地方),\
# alpha是填充空间的透明度, x是水平轴上的点, y1是数据集竖直轴上的点, y2是要与y1在每一个水平轴点处计算差值然后填充这两部分的区域, y2的默认值是0,\
# interpolate只有在使用了where参数同时两条曲线交叉时才有效, 使用这个参数会把曲线交叉处也填充使得填充的更完整
plt.fill_between(ages, py_salaries, dev_salaries,
where=(py_salaries > dev_salaries),
interpolate=True, alpha=0.25, label='Above Avg')
plt.fill_between(ages, py_salaries, dev_salaries,
where=(py_salaries <= dev_salaries),
interpolate=True, color='red', alpha=0.25, label='Below Avg')
plt.legend()
plt.title('First filled plot')
plt.xlabel('Ages')
plt.ylabel('Median Salary (USD)')
plt.tight_layout()
plt.show()
运行结果: