
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于16S纳米孔测序的海底生态状态预测:机器学习与特征选择在挪威海岸 aquaculture 监测中的应用
【字体: 大 中 小 】 时间:2025年08月04日 来源:Marine Pollution Bulletin 4.9
编辑推荐:
挪威生命科学大学团队针对 aquaculture 导致的底栖生态压力,创新性地结合16S rRNA纳米孔测序与机器学习(LASSO/RF/PLSR),通过特征选择将OTUs从数千个优化至40-60个,实现nEQR指数的高精度预测(Pearson r=0.98 Illumina/0.95 Nanopore),为海洋生态监测提供快速、经济的解决方案。
海洋底栖生态系统如同海底的"免疫系统",承担着养分循环和维持生态平衡的重任。然而,随着 aquaculture(水产养殖)的快速发展,大量残余饲料和有机废物如同"生态毒素"不断沉积,导致底栖生物群落结构发生显著改变。传统基于大型底栖无脊椎动物形态学分类的生态评估方法(如挪威标准nEQR指数)虽被广泛认可,但存在耗时耗力、依赖专业分类知识等瓶颈。如何在"生态警报"拉响前实现快速响应,成为海洋环境保护的迫切需求。
挪威生命科学大学(Norwegian University of Life Sciences, ?s)的Melcy Philip团队在《Marine Pollution Bulletin》发表的研究,开创性地将牛津纳米孔技术(ONT)长读长测序与机器学习相结合,构建了一套海底生态状态预测系统。研究人员采集挪威海岸25个 aquaculture 站点的88份沉积物样本,通过Illumina V3-V4区和Nanopore V3-V9区16S rRNA测序,采用EMU/VSEARCH等生物信息学工具生成微生物群落图谱,结合LASSO回归、随机森林(RF)和偏最小二乘回归(PLSR)算法,最终实现纳米孔数据预测误差仅±0.06的突破性成果。
关键技术方法
跨平台测序:同步进行Illumina短读长(430bp)和Nanopore长读长(1100bp)16S rRNA测序
双模式生物信息分析:采用闭参考(AQUAeD-DB数据库)和开参考(DADA2/UNOISE)两种序列分配策略
机器学习优化:通过jackknife重采样和LASSO回归筛选40-60个关键OTUs
数据标准化:Aitchison中心对数比(CLR)转换处理组成型数据
研究结果
测序平台等效性验证
PLSR分析显示Illumina与Nanopore预测误差无显著差异(±0.10 vs ±0.10),打破纳米孔技术精度不足的固有认知。开参考分析方法虽识别更多OTUs(如UNOISE达92,808个),但预测效能未优于闭参考方法。
特征选择突破
通过25轮jackknife-LASSO筛选,将特征数从数万个压缩至36(Illumina)和43(Nanopore)个核心OTUs,使预测误差降低50%以上。值得注意的是,硫氧化菌和氨氧化古菌等功能类群被高频选中,印证其在生态指示中的枢纽地位。
跨平台特征通用性
当将Illumina筛选的特征集应用于Nanopore数据时,仍保持0.88的预测相关性(原值0.95),表明不同测序技术捕获的生态信号具有内在一致性。
研究意义
该研究首次证实纳米孔测序在海洋生态监测中的实用价值,其便携性和实时性为现场监测提供可能。特征选择策略突破"大数据陷阱",将复杂微生物群落简化为可操作的生物标志物组合。特别值得注意的是,研究发现不同技术平台筛选的OTUs虽仅有4个重叠,但均指向硫循环和氮循环相关功能类群,暗示微生物功能而非单纯分类学特征才是生态状态预测的核心要素。
研究也存在样本量局限(88个样本)和地理范围集中(挪威海岸)的不足。正如作者指出,未来需在更大时空尺度验证特征稳定性,并探索纳米孔duplex测序等新技术以进一步提升精度。这项成果为《欧盟海洋战略框架指令》要求的生态监测提供了革命性工具,使"从实验室到甲板"的实时环境评估成为可能。
生物通微信公众号
知名企业招聘