当两个数据集的信息存在差异时,你会如何去找到他们的差异?其实这是一件很费时和费力的事情。在这里推荐R的daff包,daff包可以进行行和列的比较,并能找出具体哪些值变化了,添加了哪些新行(列)或删除了哪些行(列),最主要是它能把比较的结果可视化并保存下来,我觉得这是一个非常方便和非常实用的包。
####安装并加载包
install.packages("daff")
library(daff)
####生成模拟数据
mydata1<-data.frame(Name=c("P1","P2","P3","P4","P5"),col1=c(1,2,3,4,5),col2=c(11,13,14,15,17))
mydata2<-data.frame(Name=c("P1","P2","P6","P4","P5"),col1=c(1,3,3,6,9))
####mydata2和mydata1相比,有哪些异同
d=diff_data(mydata1, mydata2)
d
---:表示从数据集中删除的行,如果该符号出现在列上方,则表示该列已从数据集移除
+++:表示新增的行
####如果觉得看的不是很清楚,则可以将比较的结果输出
render_diff(d)
####你可以将比较的结果输出
out<-diff_data(mydata1,mydata2,id="Name")
write_diff(out,"F:\\compare.csv")
####不用代码保存也是可以的,如下图所示,可以直接点击处于两个表中间的csv, excel, 或PDF保存。另外你可以点击下左上方的按钮保存为html格式
参考资料:R帮助文件
如果大家觉得今天的内容对大家有帮助, 欢迎关注我们的公众号哦:R语言与SPSS学习笔记
R语言与SPSS学习笔记
分享实用的SPSS及R处理数据、分析数据及做图的使用技巧