提到RNA-Seq差异表达分析,人们首先想到的是两个实验条件下的差异表达,比如说癌组织与癌旁等。但有时候研究人员想要探究某种实验处理方法在不同时间下对目标产生的影响,就会出现时序RNA-Seq,也就有了RNA sequencing time course data。传统两个实验条件下的差异表达已经研究的很成熟了,但时序RNA-Seq的差异表达分析尚处于起步阶段,许多研究都采用两两比较的方式进行分析。
目前,在omictools网站上列举了12个与时序RNA-Seq分析相关的工具[Figure 1],但随之而来的问题就是,哪些工具好用,以及是否比传统的两两比较更有优势。
2017年,在『Briefings in Bioinformatics』上发表了一篇论文,对这些工具进行了比较。
首先还是给出文章:
Comparative analysis of differential gene expression tools for RNA sequencing time course data
文章对AdaptiveGP (nsgp)、DyNB、EBSeqHMM、FunPat、ImpulseDE2、lmms、Next maSigPro 、splineTimeR (splineTC)、TimeSeq以及两两配对分析的工具edgeR/DESeq2 进行了比较。
简单来说,文章先生成一个模拟数据集,来对上面提到的工具进行差异表达的比较分析。接着将时序分析工具与传统两两比较的软件进行了对比。最后在一个真实的数据集(GSE69822)上测试表现最好的软件。
文章最后得出结论:除了ImpulseDE2、splineTC、maSigPro, TC RNA-seq tools只能部分解释数据集的时序特征。意料之外的是,时间点的两两比较在标准的实验条件下仍然是最稳定、准确的方法。唯一的例外是ImpulseDE2,但有更多的噪音。增加样本能够提高所有软件的表现,但增多时间点只能增强maSigPro和splineTC。因此,目前的time course tools只有在时间点设置较多的时候比传统两两比较的方法好。
we conclude that combining candidates of several methods is the most reliable and cost-effective trade-off to increasing replicates or time points.
文章最后给出key point:
- Time course analysis tools are outperformed by the classical pairwise comparison approach on short time series, except of ImpulseDE2.
- Overlapping of candidate lists between similar tools reduced FPs to a greater extent than TPs.
- splineTC and maSigPro have best overall performance on long time series data.
该文章所有的数据、脚本都可以下载学习,有时间建议大家看一看~~~