利用人工智能监控环境
微生物在生态系统中发挥着重要作用,其多样性反映了其生存环境的健康状况。然而,在目前的生物监测项目中,由于难以识别它们,它们仍在很大程度上未得到充分利用。来自瑞士日内瓦大学(UNIGE)的研究人员最近开发了一种结合两种前沿技术的方法来填补这一空白。他们使用基因组工具对样品中的微生物DNA进行测序,然后利用人工智能利用这些数量可观的数据。它们建立预测模型,能够对生态系统的健康状况进行大规模的诊断,并识别出具有重要功能的物种。这项发表在《微生物学趋势》(Trends in Microbiology)杂志上的新方法将显著提高大型生态系统的观察能力,并减少非常有效的常规生物监测程序的分析时间。
在可持续发展和人类对环境的压力日益增加的情况下,监测生态系统的健康状况至关重要。不同种类的微生物对环境变化敏感,可作为监测环境质量的生物指标。然而,它们的形态识别需要大量的时间和专业知识。“一年前,我们能够仅根据样本中单细胞藻类的DNA序列建立水质指数,而不需要直观地识别每一种藻类,”UNIGE科学学院遗传与进化系教授Jan Pawlowski解释说。
使用DNA序列而无需识别它们
基因组工具使快速和非常准确地描述居住在环境中的生物群落成为可能。然而,由于许多DNA序列在现有的数据库中没有被引用,因此大部分数据不能用于环境健康诊断。因此,拥有这些序列的物种及其生态作用都是未知的。“为了利用所有环境基因组数据,即样本的所有生物多样性,我们使用了一种机器学习算法,”日内瓦小组成员、该研究的第一作者特里斯坦·科迪尔(Tristan Cordier)指出。
生物学家使用了已知的不同生态质量状态的样本,从好的到坏的,从这些样本中他们对DNA进行了测序。这些信息的组合使他们能够利用每个样本的数据构建一个参考系统。“然后,基于我们的训练数据,用这种算法开发了一个预测模型。”这些数据包括参考诊断数据和未知物种测序数据,”Jan Pawlowski说。通过将新的参考样本包含到现有的训练数据集,可以对该模型进行改进和验证。
发现新的生物指示器
这两种前沿技术的结合使得不需要识别DNA序列就能获得其生态价值成为可能。通过这种方法可以发现已经描述或尚未描述的具有重要功能的微生物种类以及新的生物指标。“我们的研究与人类微生物组的研究有一些相似之处。这两项研究的目的都是揭示微生物群落,并确定可作为检测环境污染或人类疾病的强大诊断工具的生物标志物。