数据可视化
2.7如何让人一眼看懂你的数据
在终端输入 :
即可运行import matplotlib.pyplot as plt指令
2.7.1 任务一:
了解matplotlib,自己创建一个数据项,对其进行基本可视化
Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。
为什么选择 Matplotlib?
如果某天你发现自己要学习 Matplotlib, 很可能是因为: 1、Matplotlib 是一个非常强大的 Python 画图工具;2、手中有很多数据, 可是不知道该怎么呈现这些数据。
Matplotlib 能帮你?
绘制线图、散点图、等高线图、条形图、柱状图、3D 图形、、甚至是图形动画等等。
参考:https://www.matplotlib.org.cn/
折线图
散点图,设置color和marker样式
2.7.2 任务二:可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)
先把数据进行分组,再绘制
plot.bar()柱状图
plt.title()为绘制出来的图表命名
2.7.3 任务三:可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图(用柱状图试试)
Title 为图像标题,Axis 为坐标轴, Label 为坐标轴标注
2.7.4 任务四:可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况。(用折线图试试)(横轴是不同票价,纵轴是存活人数)
- groupby()将数据分组
- grid的目的是从x值数组和y值数组中创建一个二维矩形网格
plt.grid(True) # 显示背景的网格线
plt.grid(False) # 关闭背景的网格线 -
figsize() 用来确定图形的大小(以英寸为单位)。 较大的图形尺寸将允许显示更长的文本,像素尺寸相同时,图形尺寸越大,所能容纳的内容越多
参考:https://mp.weixin.qq.com/s?__biz=MzU4MzkxOTgyOQ==&mid=2247486963&idx=1&sn=6a7b9fad6d7de505ae9acc809e91d450&source=41#wechat_redirect
https://zhuanlan.zhihu.com/p/41781440
2.7.5 任务五:可视化展示泰坦尼克号数据集中不同仓位等级的人生存和死亡人员的分布情况。(用柱状图试试)
2.7.6 任务六:可视化展示泰坦尼克号数据集中不同年龄的人生存与死亡人数分布情况。
- Seaborn是一种基于matplotlib的图形可视化python libraty。它提供了一种高度交互式界面(统计图表)
seaborn 的countplot可以对dataframe中的某一列或者某两列进行统计
sns.countplot(x="Age", hue="Survived", data=text) - countplot() 以比较类别间计数差,调用count函数的barplot
- seaborn的barplot()利用矩阵条的高度反映数值变量的集中趋势,展示的是某种变量分布的平均值
参考:https://zhuanlan.zhihu.com/p/24553277
2.7.7 任务七:可视化展示泰坦尼克号数据集中不同仓位等级的人年龄分布情况。(用折线图试试
- Pclass_age=text.groupby(['Pclass'])['Age'].value_counts()
Pclass_age
fig = plt.figure(figsize=(20, 18))
Pclass_age.plot(grid=True)
plt.legend()
plt.show() -
得到
-
相关总结
图例的位置可以通过关键字参数loc指定
https://zhuanlan.zhihu.com/p/41781440
https://blog.csdn.net/Jinlong_Xu/article/details/70175107