好久没写文章了,最近有点忙,今天来更新一波!
绘制矩阵散点图
1.将 R 的内置数据集 longley 作为本次作业的数据集,将 longley 数据集内变量名为 Year
的列给删除掉。
head(longley)
mylongley = longley[-6]#去除Year特征
head(mylongley)
直接绘制带有回归线的散点图矩阵
mypanefun = function(x,y){
points(x,y)#绘制出散点
#绘制一个回归线,y对x回归线
# y = kx
# 线性回归算法
abline(lm(y~x),col='purple')#绘制直线
}
pairs(mylongley,panel = mypanefun)#panel接收一个函数
#总结一下pairs的参数
#lower.panel=NULL代表去除下半部分的图形,因为其实上半部分和下半部分是一样的
#upper.panel=NULL代表去除上半部分的图形
#还有col,pch,cex与之前博文里面提到的类似
绘图结果
绘制相关图
#由相关系数可以得出什么?
#正数:正相关
#负数:负相关
#0 :不相关
#正数数值越大相关性越强
#默认的方式:异常值影响比较大,可选用如下两种进行优化
#默认的方式:异常值影响比较大,可选用如下两种进行优化
mycor = cor(mylongley,method = "spearman") #斯皮尔曼
cor(mdata,method = "kendall") #肯德尔
install.packages("ggcorrplot")
library(ggcorrplot)#载入第三方包
ggcorrplot(mycor)#这样显示不美观,下面进行优化
ggcorrplot(mycor,lab = T,hc.order = T,title='李浩琦',legend.title='MyCor'
,outline.color = "green")
# lab = T 图像可以显示数值,看起来更直观
#常用其它参数总结:
#method 允许的值为“square”(默认值)、“circle”。
#type = 'upper'只展示图像上面半部分的数据(也就是右下角不显示)lower类似
#hc.order = T 表示把相关性相同(颜色相同)聚集在一起来显示
#title图形的标题
#legend.title='MyCor'指定右边图例名称
#show.legend,如果为真,则显示图例,默认显示右边
#outline.color方形或圆形的轮廓颜色。默认值为“gray”
绘图结果
绘制函数图像
curve(expr=x^3+sin(x)#expr要绘制的函数
,from = 1#从1到100
,to = 100
,n = 100#使用100个点
,main=expression(x^3+sin(x))#main标题
,ylab = 'y'#xlab x标签
,xlab = "x"#ylab y标签
)