idat数据类型
该包包含两个测试数据集,一个是HumanMethylation450 data (.idat)
,另一个是模拟的EPIC data
,可以用来测试ChAMP中可用的函数。这可以通过将目录指向testDataSet来加载,如下所示:
library("ChAMP")
testDir=system.file("extdata",package="ChAMPdata")
myLoad <- champ.load(testDir,arraytype="450K")
450k肺肿瘤数据集仅包含8个样本,4个肺肿瘤样本(T)和4个对照样本(C),我们使用这个数据集来展示ChAMP的功能。
对于EPIC仿真数据集,我们可以使用以下代码进行加载:
data(EPICSimData)
该仿真数据集包含16个样本,它们实际上都来自一个样本,但都被修改为DMP和DMR,并且单独存在一些误差方差。在这16个样本数据集中,我们模拟了8个样本作为对照,8个样本作为case,样本在EPICSimData对象的pd中标记。在此数据中,我们从bumphunter package的clusterMaker()函数中随机选取5000个区域。在每个区域,我们随机选择一些连续的CpGs作为DMR,然后增加或减少该DMR的beta值。因此,该数据集中的DMR(4700+)应该小于5000,因为一些模拟DMR只包含1-2个CpGs,所以在champ.DMR()函数中不被认为是DMR。用户可以使用这些数据测试ChAMP在EPIC数据上的功能。
450k肺肿瘤数据集仅包含8个样本,4个肺肿瘤样本(T)和4个对照样本(C),接下来,我们使用450K这个数据集来展示ChAMP的功能。
ChAMP包用于分析Illumina甲基化beadarray数据(EPIC和450k),并提供了一个集成分析450k和EPIC分析方法。这包括各种不同的数据导入方法(例如从.idat文件或beta值矩阵导入
)和质量控制图。
Type-2 probe correction methods include SWAN1, Peak Based Correction (PBC)2 and BMIQ3 (the default choice).
minfi包也提供了流行的功能归一化方法。
奇异值分解(SVD)方法允许处理批次效应,纠正多个批次处理效果,采用Combat包实现。采用RefbaseEWAS9可以校正细胞类型的异质性。
ChAMP还包括一个函数,该函数可以从450k或EPIC数据中推断拷贝数变异。
为了识别差异甲基化区域(DMR), ChAMP除了提供Bumphunter和DMRcate这两种检测差异甲基化的方法,还提供了新的Probe Lasso Method。
对于那些需要寻找差异甲基化区块( Differentially Methylated Blocks
)的人,新版ChAMP包含了一个检测这些区块的功能。
基因集富集分析(GSEA)也是可能的,ChAMP的新版本结合了一些方法,可以纠正由于基因中探针表示不均匀而造成的偏差。
此外,新版ChAMP还整合了FEM 包,该包可以在用户指定的基因网络(表现出不同表型间甲基化的差异)中推断基因模块。
虽然还有一些管道和包可以用于450k或EPIC阵列分析(比如IMA、minfi、methylumi、RnBeads和wateRmelon)。ChAMP提供了一个更加全面完整的分析管道,从读取原始数据文件到最终的三级分析结果,例如GSEA,它为研究人员简化了甲基化阵列分析。新版ChAMP还提供了一系列闪亮的、基于程序的web浏览器交互分析函数(GUI函数),以帮助科学家查看ChAMP的结果。这需要一个基于web浏览器的交互式框架,用于本地或远程调用图形系统。
安装
if (!requireNamespace("BiocManager", quietly=TRUE))
install.packages("BiocManager")
BiocManager::install("ChAMP")
Test Data
该包包含两个测试数据集,一个是HumanMethylation450 data (.idat)
,另一个是模拟EPIC data
,可以用来测试ChAMP中可用的函数。可以像下面这样将目录指向testDataSet来加载它
library("ChAMP")
testDir=system.file("extdata",package="ChAMPdata")
myLoad <- champ.load(testDir,arraytype="450K")