相关关系包括线性相关和非线性相关。线性相关也叫直线相关,非线性相关也叫曲线相关。
相关关系主要采用皮尔逊(Pearson)相关系数 r 衡量。
取值范围[-1,1],绝对值小于0.3低度相关,大于0.8高度相关。
数据源:https://pan.baidu.com/s/1T8oiS_bx2lSXjj-KXBYleg
代码如下:
import pandas as pd
data=pd.read_csv('C:/Users/86138/Desktop/PDABook/wu/xiangguan/fenxi.csv')
print(data.head())
a=data['人口'].corr(data['文盲率']) #人口和文盲率的相关系数
print(a)
b=data[['超市购物率','网上购物率','文盲率','人口']].corr() #四个之间的相关系数
print(b)
输出