学习资料:
我主要想学习可视化方面的内容,从matplotlib入门,课程是万门的课程,讲的一般。地址就不放出来了,自己搜一下万门大学即可。下面有个学堂在线的免费课,想入门的也可以参考这个:
Python大数据分析 https://next.xuetangx.com/course/sdu298162cc/1520600
1. Python安装:
下载Anaconda,傻瓜式安装,numpy,matplotlib等framework工具包都会统一安装配置好,直接用就行
下载地址:https://www.anaconda.com/
2.可视化基本流程
数据准备 - 数据清理 - 定义可视化观点 - 可视化形式 - 输出结论(有机会单独一章展开讲)
3.打开Python JupyterLab
两种方式都可以打开:
1.从Mac自带的terminal,输入“jupyterlab”进入
2.打开anaconda在launchpage选择jupyterlab
4.Matplotlib基础配置
4.1 导入工具包,定义缩写
工具包的名称会比较长,通常会在前面定义一个缩写,比如matplotlib.pyplot定义为plt,后面调用的时候统一用plt就可以进行指代了。
import matplotlib
from matplotlib import pyplot as plt #简写matplotlib为 plt
import numpy as np
import scipy
#了解numpy,scipy:https://blog.csdn.net/u013317445/article/details/72083395
from scipy import stats
%matplotlib inline
#旧版本需要加上这一句才能在代码框中显示图像,如果不使用这句魔法命令图形就会另外打开一个窗口
一些常用快捷键:shift+tab 可查看代码函数帮助
4.2 基础图形
- 曲线图:matplotlib.pyplot.plot() #用于表示连续变量
练习:
x = np.arange(-5,5,0.1) #从-5到5的数组,间隔0.1
y = x**2 #函数:x的2次方
plt.plot(x,y,color='g',linestyle='--',marker='+')
#曲线图 /颜色/线型/标记
直方图:matplotlib.pyplot.hist() #x轴离散,y轴连续
散点图:matplotlib.pyplot.scatter()
箱式图:matplotlib.pyplot.boxplot()
4.3基础样式
Matplotlib可配置的图表元素非常灵活,包括legend、title、axis、曲线、点等,这也是它用起来比较复杂的原因之一
图表样式配置练习:
y1 = x**2
y2 = x**3
y3 = x**1
plt.plot(x,y1,'r+',label='line1') #样式可以合并写在一起'r+-',顺序颜色/标记/线型
plt.plot(x,y2,label='line2')
plt.plot(x,y3,label='line3')
plt.legend(loc = 'lower right') #图例
plt.title('test') #图表标题
plt.xlabel('x test') #x轴标题
plt.ylabel('y test') #y轴标题