最近在用R学习单细胞转录组分析,让我比较头大的是seruat包,这个包的2.0+版本与3.0+版本差异真的很大。
参考视频是bilibili上‘生信技能树’的教学视频,用的是seruat2.3.4(下文中简称2+),但是我在安装的时候是seruat3.1.4(下文中简称3+),这就导致R包自带的很多功能出现了误差,下面就介绍几个我今天接触到的,自己理解的一些区别,请大神批评指正。
首先是构建seruat对象,需要的参数还是counts和meta矩阵,
2.0+是这样的:S=CreateSeuratObject(raw.data = counts,
project = "NA",
meta.data =meta,
min.cells = 4,
min.genes = 200)
3.0+是这样的:S=CreateSeuratObject(counts,
project = "NA",
assay = "RNA",
min.cells = 4, ##cells 过滤
min.features = 2000, ##genes 过滤
names.delim = "_",
meta.data = meta)
区别是3.0+没有row.data,直接添加counts,min.genes变成min.features,得到的seruat对象中没有了row.counts矩阵,只剩meta.data矩阵,原本的row.counts数据直接用seruat对象代替了。如原来的rownames(S@row.counts)变成rownames(S)。这个在计算percent.ercc等时会有用到。
第二个就是很多函数都发生了改变,所以每次看到函数都要先?一下
2.0+ 3.0+
GenePlot FeatureScatter
CellPlot CellScatter
FindVariableGenes FindVariableFeatures
...还有一些还在继续探索中
tips:今天下载R软件的时候发现一个能使下载速度飞起来的方法,那就是利用镜像
比如:install_github("immunogenomics/harmony")
#http://cran.r-project.org/bin/windows/Rtools/.下载的时候只有几k每秒,屡次怀疑家里wifi是不是被限流了,泪奔
#https://mirrors.tuna.tsinghua.edu.cn/CRAN/bin/windows/Rtools/利用镜像下载软件速度飞快