作为人体最大和最复杂的生态群落,肠道微生物群及其代谢产物在调节生理稳态和疾病出现方面均起着重要作用,对人类健康至关重要。
来自中山大学的研究人员开发了gutMEGA数据库,旨在对已发表的人类肠道微生物宏基因组数据集进行整理,从而为研究人员提供肠道微生物在不同条件下丰度变化的直观数据。其相关研究成果已发表在《Briefings in Bioinformatics》。
研究团队收集了182项研究,并对相关数据进行了进一步的处理。根据精心设计的再匹配过程,所有分类群重新映射到完全分类。共收集整理了776个条件下的6457个类群,包括59132个不同分类水平(界、门、纲、目、科、属、种)的定量事件。同时开发了一个用户友好的交互式数据库(gutMEGA)来管理和托管这些数据集。
为什么要构建gutMEGA?
缺乏直观地显示微生物在不同条件下动态变化的数据库
随着高通量技术的快速发展,各种人肠道宏基因组数据不断积累。在不同的实验条件下这些配置文件的量化可以提供有用的洞察肠道微生物调节的生物过程。
目前尽管已经有各种数据库存储宏基因组数据并提供分析流程,甚至提供样品的微生物组成和相应的元数据信息,但仍需要建立一个直观地显示微生物在不同条件下动态变化的数据库。由于肠道菌群的变化在不同时空背景下对人体健康至关重要,因此,肠道菌群的综合资源可以促进已发表的宏基因组数据集的重用,为宏基因组相关研究提供极大的帮助。
为了快速、直观地获取不断增长的肠道微生物信息,研究团队开发了gutMEGA数据库。与现有的宏基因组相关数据库不同,通过将实验条件与微生物丰度变化相匹配,研究人员可以获得他们感兴趣的表型或微生物群的景观,或者通过gutMEGA将他们自己的结果与已发表的研究进行比较。
gutMEGA能做什么?
查询功能
gutMEGA提供快速搜索和高级搜索两种方式对数据库中的数据进行查询。结果表默认以p值排序,用户也可以重新按taxon,condition或者log2ratio进行排序。同时,用户可以通过condition或者log2ratio对结果进行进一步筛选,或者直接输入关键词搜索表格。
Detail按钮:可以看到实验相关信息(包括PMID,实验地点,样本类型,测序方法,测序平台,参与人数,生物学重复数目等),同时还提供了原始数据。
浏览功能
在browse页面,数据库中的信息被分类为
Taxonomy,Condition,Sample,用户可以浏览并选择感兴趣的内容查看结果。
数据下载
在Download页面展示了gutMEGA中可下载的数据信息列表。
gutMEGA使用场景示例
实验前/后都可以使用gutMEGA辅助实验设计和验证实验结果
已有研究表明肠道微生物菌群和与结直肠癌相关。我的实验目的是了解消化链球菌在结直肠癌患者和健康人中的差异。实验前,我希望尽可能了解大肠癌中消化链球菌的丰度变化,以保证实验设计的准确性。我可以已以结直肠癌(Colorectal cancer)和消化链球菌属(Peptostreptococcus)为关键词进行搜索,结果在5个数据集中,显示结直肠癌患者的消化链球菌明显高于健康对照组,提示消化链球菌可能参与了结直肠癌的发生和发展。这个结果得到了发表在Nature Microbiology上的Peptostreptococcus Anaerobius Promotes Colorectal Carcinogenesis and Modulates Tumour Immunity一文的验证:发现厌氧消化链球菌在结直肠癌变中发挥作用,调节肿瘤免疫。
同样的如果我通过实验分析发现结直肠患者中消化链球菌丰度较高,并且想要验证这一结果的可靠性,也可以使用gutMEGA作为验证资源。因此,gutMEGA不仅提供疾病相关微生物变化的全面信息,还可作为研究人员探索和查询的资源
gutMEGA访问地址:http://gutmega.omicsbio.info.
首发公号:国家基因库大数据平台
参考文献
Zhang Q, Yu K, Li S, et al. gutMEGA: a database of the human gut MEtaGenome Atlas[J]. Briefings in Bioinformatics, 2020.
图片来源:gutMEGA官网、参考文献,如有侵权请联系删除。