目的
和转录组或蛋白组的分析原理类似,目的是:
将大量的差异代谢物降维到少量的显著富集的代谢通路,方便解释科学问题;
从通路水平上可以更好解释表型背后的生物学原理/过程。
富集分析方法
富集分析的本质:某个代谢通路在不同的状态下(如疾病与健康)是否发生了显著变化?
ORA富集
回答的问题:一个代谢物集合(如某个代谢通路)中所包含的差异代谢物的数量是否显著地比随机取样获得的差异代谢物的数量更多?
零假设:代谢通路A中的差异代谢物数量不比随机取样获得的差异代谢物数量多。
备择假设:代谢通路A中差异代谢物显著富集。
符合超几何分布,使用超几何检验或费舍尔精确检验。
ORA优点:
计算原理简单、结果易懂;输入数据简单。
ORA缺点:
- 舍弃了很多有用信息,如差异离子的fold change的大小等;
- 仅仅使用了最显著差异的代谢物,如FC=1.99的被舍弃了;
- 对背景的假定是全部检测到的代谢物,而实际上应该是全部的代谢物,仪器的检测偏差会影响富集结果;
- 假定所有的代谢物都是独立的,而实际上它们不是独立的。代谢物间存在协同作用,一个代谢物可以属于不同的代谢通路。
FCS富集
Functional class scoring。
代谢通路的变化程度应该用该通路中所有注释到的离子的变化情况来衡量。若该通路中每一个代谢物都有相同趋势的变化,尽管单个代谢物不显著,该通路依然是显著变化的。
计算过程:
- 计算每一个代谢物的显著性,如fold change,p值等;
- 根据某一个通路中所有注释到的代谢物的变化情况计算通路水平的显著性;计算方法可以是多变量的,如Kolmogorov-Smirnov statistic,也可以是简单的单变量的,如代谢物水平显著性的和,均值,中值等。
- 根据通路的显著性,筛选有显著变化的通路。
FCS优点: - FCS不仅仅考虑差异代谢物,其考虑是某个通路中全部的代谢物的变化;
- ORA忽略了代谢物的变化程度,而FCS将代谢物变化程度考虑了进来;
- FCS考虑注释到某个通路中的全部代谢物的变化,考虑了代谢物间的协同作用关系。
FCS缺点: - FCS一次只考虑一个通路,而不同通路之间的代谢物是有重叠的,FCS并没有考虑这种重叠关系;
- 大部分FCS算法在考虑代谢物变化程度的时候用的是变化程度的排序;如A代谢物的fold change是20 或者2,只要他们的排序一样,在FCS中就一样。
工具
代谢物富集分析在线工具:
MBROLE: http://csbg.cnb.csic.es/mbrole2/
MetaboAnalyst:
https://www.metaboanalyst.ca/