基于16S纳米孔测序的海底生态状态预测:机器学习与特征选择在挪威海岸 aquaculture 监测中的应用

【字体: 时间:2025年08月04日 来源:Marine Pollution Bulletin 4.9

编辑推荐:

  挪威生命科学大学团队针对 aquaculture 导致的底栖生态压力,创新性地结合16S rRNA纳米孔测序与机器学习(LASSO/RF/PLSR),通过特征选择将OTUs从数千个优化至40-60个,实现nEQR指数的高精度预测(Pearson r=0.98 Illumina/0.95 Nanopore),为海洋生态监测提供快速、经济的解决方案。

  

海洋底栖生态系统如同海底的"免疫系统",承担着养分循环和维持生态平衡的重任。然而,随着 aquaculture(水产养殖)的快速发展,大量残余饲料和有机废物如同"生态毒素"不断沉积,导致底栖生物群落结构发生显著改变。传统基于大型底栖无脊椎动物形态学分类的生态评估方法(如挪威标准nEQR指数)虽被广泛认可,但存在耗时耗力、依赖专业分类知识等瓶颈。如何在"生态警报"拉响前实现快速响应,成为海洋环境保护的迫切需求。

挪威生命科学大学(Norwegian University of Life Sciences, ?s)的Melcy Philip团队在《Marine Pollution Bulletin》发表的研究,开创性地将牛津纳米孔技术(ONT)长读长测序与机器学习相结合,构建了一套海底生态状态预测系统。研究人员采集挪威海岸25个 aquaculture 站点的88份沉积物样本,通过Illumina V3-V4区和Nanopore V3-V9区16S rRNA测序,采用EMU/VSEARCH等生物信息学工具生成微生物群落图谱,结合LASSO回归、随机森林(RF)和偏最小二乘回归(PLSR)算法,最终实现纳米孔数据预测误差仅±0.06的突破性成果。

关键技术方法

  1. 跨平台测序:同步进行Illumina短读长(430bp)和Nanopore长读长(1100bp)16S rRNA测序

  2. 双模式生物信息分析:采用闭参考(AQUAeD-DB数据库)和开参考(DADA2/UNOISE)两种序列分配策略

  3. 机器学习优化:通过jackknife重采样和LASSO回归筛选40-60个关键OTUs

  4. 数据标准化:Aitchison中心对数比(CLR)转换处理组成型数据

研究结果

  1. 测序平台等效性验证

    PLSR分析显示Illumina与Nanopore预测误差无显著差异(±0.10 vs ±0.10),打破纳米孔技术精度不足的固有认知。开参考分析方法虽识别更多OTUs(如UNOISE达92,808个),但预测效能未优于闭参考方法。

  2. 特征选择突破

    通过25轮jackknife-LASSO筛选,将特征数从数万个压缩至36(Illumina)和43(Nanopore)个核心OTUs,使预测误差降低50%以上。值得注意的是,硫氧化菌和氨氧化古菌等功能类群被高频选中,印证其在生态指示中的枢纽地位。

  3. 跨平台特征通用性

    当将Illumina筛选的特征集应用于Nanopore数据时,仍保持0.88的预测相关性(原值0.95),表明不同测序技术捕获的生态信号具有内在一致性。

研究意义

该研究首次证实纳米孔测序在海洋生态监测中的实用价值,其便携性和实时性为现场监测提供可能。特征选择策略突破"大数据陷阱",将复杂微生物群落简化为可操作的生物标志物组合。特别值得注意的是,研究发现不同技术平台筛选的OTUs虽仅有4个重叠,但均指向硫循环和氮循环相关功能类群,暗示微生物功能而非单纯分类学特征才是生态状态预测的核心要素。

研究也存在样本量局限(88个样本)和地理范围集中(挪威海岸)的不足。正如作者指出,未来需在更大时空尺度验证特征稳定性,并探索纳米孔duplex测序等新技术以进一步提升精度。这项成果为《欧盟海洋战略框架指令》要求的生态监测提供了革命性工具,使"从实验室到甲板"的实时环境评估成为可能。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号