基于16S rRNA基因测序的机器学习方法识别污水处理厂特异性微生物标志物

【字体: 时间:2025年07月04日 来源:Scientific Reports 3.8

编辑推荐:

  本研究针对污水处理厂(WWTP)出水微生物群落难以溯源的问题,通过16S rRNA基因V4区测序结合机器学习算法,成功从芬兰Pirkanmaa地区6个WWTP的57份出水样本中筛选出10个具有区分效力的微生物标志物(9个细菌属和1个古菌属),其溯源准确率达92%。该研究为污水处理过程监控和污染物溯源提供了新型生物标记工具,相关成果发表于《Scientific Reports》。

  

随着城市化进程加速,污水处理厂(WWTP)排放的出水对水生态系统影响日益凸显。传统监测主要依赖化学指标和粪便指示菌(如大肠杆菌),但这些方法难以区分不同WWTP的排放源,也无法反映处理系统的微生物功能状态。更棘手的是,地理位置相近、工艺相似的WWTP排放的微生物群落往往高度相似,使得溯源工作如同"大海捞针"。在此背景下,芬兰坦佩雷大学的研究团队独辟蹊径,将机器学习与微生物组学相结合,开发了一套WWTP特异性微生物标志物识别系统。

研究团队采集了2016-2018年间Pirkanmaa地区6个WWTP的57份出水样本,通过16S rRNA基因V4区测序获得微生物群落数据。采用QIIME2进行序列分析,包括DADA2去噪、MAFFT序列比对和MiDAS数据库注释。机器学习环节创新性地组合ANOVA-F特征选择与高斯朴素贝叶斯模型,在保持92%准确率的同时将标志物数量压缩至10个关键分类单元。

WWTP effluent bacterial phyla and diversity metrics
微生物组成分析显示,所有样本共检出37个细菌/古菌门,其中变形菌门(Proteobacteria)、拟杆菌门(Bacteroidota)和厚壁菌门(Firmicutes)为优势菌群。Bray-Curtis距离矩阵和PERMANOVA分析证实各WWTP微生物群落存在显著差异(p<0.006),但α多样性指标(如Shannon指数)在多数WWTP间无统计学差异,暗示微生物丰度而非种类数量是区分关键。

Feature selection, model selection and model cross-validation
通过ANOVA-F筛选出263个具有区分潜力的菌属特征,经比较7种机器学习模型后,高斯朴素贝叶斯模型以10个特征数达成最佳性能(准确率91.6%)。交叉验证和置换检验证实模型稳定性(p=0.001),其中WWTP2和WWTP3的分类难度较高,可能与服务人口规模相近(1500 vs 1000人)有关。

Characterisation of the relevant genera
最终确定的10个标志物包括:Aquaspirillum arcticum group(北极水生螺菌)、midas_g_19012(显微镜菌科)、假弓形杆菌(Pseudarcobacter)等。SHAP值分析显示这些菌属在不同WWTP中呈现特异性分布模式,如显微镜菌科成员在WWTP2中完全缺失却在WWTP1和WWTP5富集。值得注意的是,这些菌属多属于"条件性稀有类群"(CRAT),在全局WWTP数据库中检出率不足20%,暗示其作为本地化标志物的特异性。

这项研究开创性地建立了WWTP微生物"指纹"识别体系,其重要意义体现在三方面:首先,10个标志物可通过常规PCR技术检测,大幅降低监测成本;其次,该方法能识别工艺相似的相邻WWTP排放,为流域污染溯源提供新工具;最后,研究揭示污水处理系统的微生物组装具有地域特异性,为优化生物处理工艺提供理论依据。正如作者指出,未来结合宏基因组测序将进一步提升物种分辨率,而扩大样本量和时间跨度则可增强模型的鲁棒性。这项发表于《Scientific Reports》的研究,为智慧水务和精准环境监测提供了创新性技术路径。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号