差异可变剪接软件哪家强？

作者：童蒙
编辑：amethyst

可变剪接作为转录后修饰的重要环节，对细胞的活性和疾病的发生发展都有广泛的作用。尽管目前软件很多，但是软件间的比较却比较少。作者系统地比较了10款软件，利用了一致性（consistency）、可重复性（reproducibility）、精确度（precision）、召回率（recall）和错误发现率（false discovery rate）、报道的可变剪接基因的一致性（agreement upon reported differentially spliced genes）与功能富集分析一致性等方面来评价不同的可变剪接软件。

软件主要是三大类：

exon-base ：DEXseq、edgeR、JunctionSeq、limma
isoform-base：cuffdiff2、diffSplice2
event-base：dSpliceType、MAJIQ、rMATS、SUPPA

结论

所有exon-base的软件要好于其他两个
数据集和样品数对结果的影响更大

一、研究背景

在人类中，90%-95%的exonic基因存在可变剪接；不同的可变剪接也可以作为药物的biomarker或者target。

可变剪接类型主要有五种：
SE：是高等生物中比较常见的事件，能占到40%；
A3SS：3'端选择不同的剪接位点，占18%左右；
A5SS：5‘端选择不同的剪接位点，占8%左右；
RI：内含子保留，比例大概为5%；
MXE：外显子互斥的可变剪接。

可变剪接的检测策略
isoform-base : 先构建全长转录本和定量，再来做差异分析
count-base：将基因用单个统计单元来表示，并且进行差异分析

exon-base ：利用exon来作为统计单元
event-base ：利用junction region作为统计单元

文章使用的参比数据
human prostate cancer：人类的前列腺癌的数据，28个样品；
human hepatocellular carcinoma ：肝癌数据，100个样品；
MVS， mouse validated data，敲除小鼠的转录本，包含验证过的28个基因；
HVS， human validated data，32个验证过的基因。

二、材料方法

1、各个软件说明

isoform base

cufflinks：首先构建overlap graphs，之后估计转录本丰度，最后检查差异基因和isoform；
DiffSplice：基于图论的方法来进行分析，首先基于比对构建转录本，然后对不同的path来定量丰度，最终鉴定出可变剪接体。

count base

exon-base：将序列分配到不同的特征上，例如exon或者junction；这个只能分析已知的特征，而不能推断出新的可变剪接事件；
isoform-base：通过计算每个事件(PSI)值中的拼接百分比来量化剪接事件，PSI表示该值测量从包含该事件特定形式的基因中表达的mRNA的分数。

2、数据来源

4个下载的数据

软件的详细信息

3、评估方法

针对PCa和HCa数据集

一致性：使用gene层面上的结果，来评估一致性。
precision ：部分样品与全部样品的交集比上部分样品检测的结果
recall：部分样品与全部样品的交集比上所有样品检测的结果
FDR：从正常样品中抽样产生模拟的两个组进行比较，得到的基因作为FP；FDR=FP/(相同样品数下的差异数)。

针对MVS和HVS数据集

检测率：对28和32个qPCR验证的基因进行比较；
不同深度：使用HVS，采样到20-100M，进行分析。评估precision和recall。

功能分析

使用top500 genes，利用topGO进行功能分析。

三、结果

1、检测数和一致性

检测数方面

在PCa和HCa中，发现不同的工具检测出来的数据变化很大：
PCa中cuffdiff为0 ， edgeR为4506个；HCa中SUPPA2为0，而limma为14313个
cuffdiff2检测结果最小；SUPPA也检测不多；
exon-base的方法变动随着样品增加变化大；
在有些软件中，检测的差异数随着样品增加而增加，有些软件却减少

precision方面
随着样品数不一样，整体变动大
exon-base的方法的precision高于其他两种

FDR方面
使用normal样品作为两组来进行DS检测。各个软件差异蛮大，有些FDR还很大

2、交并集比较

相关性分析：取每个工具前500个基因进行相关性分析，发现相关性很差。

不同的软件报道的事件也有偏差。

3、qPCR结果的比较

使用真集来验证precision和recall。惨不忍睹。

4、功能分析

作者做了功能分析，想从功能分析找补回来，看看功能是不是一样。

5、资源消耗

从不同的样品数进行了评估。

6、测序量的作用

大概在40-50M的时候，发现量就稳定了

7、DS基因与DEG基因的关系

做了两个列表的交集，发现关系不大。

四、总结

文章亮点

选择了10个软件，代表不同的算法
使用了较大的数据样品，数据量也够，也有qPCR结果

下一步方向

没有全面的ground truth

结论

exon-base和两款event-base的方法表现好
建议多用几款软件

五、参考文献

Mehmood A, Laiho A, Venäläinen MS, McGlinchey AJ, Wang N, Elo LL. Systematic evaluation of differential splicing tools for RNA-seq studies. Brief Bioinform. 2020 Dec 1;21(6):2052-2065. doi: 10.1093/bib/bbz126. PMID: 31802105; PMCID: PMC7711265.

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,214评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,307评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,543评论 0赞 341
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,221评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,224评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,007评论 1赞 284
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,313评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,956评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,441评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,925评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,018评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,685评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,234评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,240评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,464评论 1赞 261
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,467评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,762评论 2赞 345