今天要吹爆的这个工具是来自华南理工大学的科研团队开发的IOAT:一种用于组学数据和临床数据统计分析的交互式工具。它可以快速执行癌症基因组数据的完整分析,用于亚型发现和生物标记物识别,而无需顾虑数据安全问题和编写任何代码。因此,IOAT能让癌症生物学家和生物医学研究人员更容易和安全地分析他们的数据。
IOAT是什么?
IOAT是一个本地桌面工具,它提供了一套多组学数据整合解决方案。其主要针对csv格式数据,并将临床数据与高维多组学数据相结合,还包含各种分析流程,如数据预处理、特征选择、风险评估、聚类和生存分析。通过使用IOAT,用户可以安全、方便地在他们的私有多组学研究数据上尝试各种方法的组合,找到适合他们数据的模型进行风险评估,确定癌症亚型。同时,该工具还可以为他们提供与肿瘤分期密切相关的基因参考,促进精准肿瘤学的发展。与其他工具相比,IOAT不需要用户有任何编程基础,对私有数据也十分安全和方便。同时它结合了多组学数据和临床数据,以更好地研究不同癌症患者的生命周期。
IOAT的操作流程
IOAT的主屏幕(上图)包括几个关键功能,特征选择和聚类分析的结果可以无限次地保存在用户指定的位置。每次操作得到的热图、聚类图、生存分析图等也可以由用户保存在指定位置。用户的每一个操作步骤都会被记录在'结果'栏中。
研究团队以肺癌多组学数据为例,演示了IOAT的一般操作流程:数据导入和预处理;对高维多组学数据进行单因素和多因素分析,降低特征维数,找出与癌症密切相关的特征(特征选择);根据选择特征进行风险评估,预测患者的生存率,并通过td-ROC曲线和c指数评价模型的效果。对所选的多组学数据进行K-Means聚类,得到不同的分子亚型。根据不同的分子亚型进行生存分析,以检验组间是否存在显著差异。此外,IOAT还提供多组学数据或临床数据中离散特征(如男性和女性)的生存分析功能。
未来,研究团队除了进一步加强该工具功能之外,还计划推出针对两种使用场景的工具形式:对于公共数据(TCGA等),IOAT桌面工具的所有功能都以web的形式展示给用户,以便用户更好地分析一些公共数据集;对于私有数据,用户可以直接选择本地桌面工具IOAT来保证隐私安全,同时研究团队还将扩展IOAT桌面软件的功能,使其能够兼容用户希望使用的方法并自行添加。
IOAT下载地址及参数
# 下载地址
https://github.com/WlSunshine/IOAT-software
#操作系统
Windows
#其他要求
安装Python v3.5.6或更高版本(适用于Windows), R v3.5.1或更高版本(适用于Windows)。
#使用许可
GNU GPL 3.0
首发公号:国家基因库大数据平台
参考文献
Wu L, Liu F, Cai H. IOAT: an interactive tool for statistical analysis of omics data and clinical data[J]. BMC bioinformatics, 2021, 22(1): 1-14.
图片来源于参考文献,如有侵权请联系删除。