Tools for mapping high-throughput sequencing data
2017年过去了,大家都在总结过去的一年发生的故事,网易云音乐告诉你一年听了哪些歌,支付宝告诉你花了多少钱。但是最让我不可思议的是一张图片的更新。
这张图的历史可以追溯到到6年前,bioinformatics的一篇文章 Tools for mapping high-throughput sequencing data。过去10年中高通量测序技术的快速发展,比如说DNA-Seq,ChIP-Seq, RNA-Seq, BS-Seq等,使得如何将测序得到的数据又快又准的比对到参考基因组方便下游分析成了刚需。为了解决这个问题,市面上出现了大量的比对软件,良莠不齐。
为了方便大家选择合适的软件,该文章把从2001年开始出现的比对软件都做了一次汇总,于是得到了下图:
很多类似的整理在发表文章后就会处于无人维护的状态,好一点的情况式能打开网页,就是数据旧了点,差一点就是404 NOT FOUND。而这篇文章却能坚持到现在,每年都更新,一方面说明发表文章的团队非常的良心,当然这也有可能说明一个问题: 比对软件的选择似乎成了习惯,BWA, Bowtie, TopHat, HISAT2, STAR里面选吧。于是除非有重大算法突破,不然很拿出现新的比对软件了。
让我们看下这个最新的RNA-Seq比对软件--DART吧
DART: a fast and accurate RNA-seq mapper with a divide and conquer strategy
DART是最近刚发表在bioinformatics上的RNA-Seq比对软件,名字全称是Division based Alignment for RNA-Seq Transcripts, 它能够不需要任何注释信息就可以进行剪切联配。这个工具和之前基于seed和动态规划不同,DART将要给read分成一个和多个片段代替了seed拓展一步,使得速度变得更快,还保证了准确性。
从官方提供的测序来看,软件还是比较吃内存的,8G的笔记本看来是带不动,只能继续用HISAT2了。
GitHub项目地址: https://github.com/hsinnan75/DART
PS: 我还没有具体测试过。