基于迭代训练卷积神经网络与广义加性模型的海域沙美元(Echinarachnius parma)丰度估算研究

【字体: 时间:2025年07月19日 来源:Ecological Modelling 2.6

编辑推荐:

  本研究针对海底生物种群量化中人工标注效率低下的问题,创新性地提出结合迭代训练卷积神经网络(CNN)与广义加性模型(GAMs)的自动化检测框架。通过316,750张海底图像分析,实现了沙美元(E. parma)的高精度检测(F1分数达0.90),估算出大西洋中部海域约5660亿个沙美元(密度16.0/m2),为海洋生态监测提供了高效可靠的技术路径。

  

海洋生态研究长期以来面临底栖生物种群量化难题,传统拖网捕捞效率低下且破坏生态,而光学调查虽能非侵入式获取海量图像,但人工标注数百万张照片的成本令人望而却步。以沙美元(Echinarachnius parma)为例,这种在浅海生态系统中占据重要地位的生物,其基础种群数据长期匮乏。更棘手的是,现有卷积神经网络(CNN)方法存在两大瓶颈:训练需大量标注数据,且模型输出的置信度无法直接转化为科学可用的种群估计值。

针对这些挑战,来自美国国家海洋与大气管理局(NOAA)渔业研究中心的研究团队在《Ecological Modelling》发表创新成果。他们开发出"迭代训练-统计校正"双轮驱动的新范式:首先通过YOLO v7卷积神经网络实现沙美元的自动化检测,采用"初始训练→机器标注→人工校正→再训练"的迭代流程,将所需人工标注量降低90%;随后构建广义加性模型(GAMs)将CNN输出的置信度转化为真实概率,结合深度、经纬度等环境协变量,建立包含零膨胀校正的两阶段"门槛模型",最终实现从图像检测到种群估算的全链条分析。

关键技术包括:(1)基于VIAME平台的YOLO v7目标检测;(2)700张图像的校准集构建;(3)包含空间平滑项的二元GAM(解释66%偏差)与准泊松GAM(解释92%偏差)的组合模型;(4)回归克里金空间插值法。研究覆盖2015年大西洋中部35,311 km2海域的316,750张Habcam调查图像。

【结果】

  1. 迭代训练效果:经过3轮迭代,第二代模型在测试集达到最佳平衡(F1=0.90),精确度0.44,召回率0.88。深度与置信度的交互效应显著(p<10-15),证明环境协变量可有效修正误检。

  2. 密度分布特征:沙美元呈现明显深度偏好,30-55 m区域密度最高(峰值达4821/m2),70 m以深区域几乎绝迹。GAM估算克服了传统F1截断法两倍的低估偏差。

  3. 种群总量:全域估算5660±60亿个沙美元,平均密度16.0/m2,与邻近乔治浅滩人工调查结果(1.28-56.68/m2)形成互证。

【结论】
该研究首次实现CNN输出与生态统计模型的深度融合,其创新性体现在:(1)迭代训练框架将标注成本降低一个数量级;(2)GAMs模型通过引入深度、空间坐标等协变量,使在55-70 m深度的误检率降低98%;(3)两阶段门槛模型有效解决零膨胀问题。相比传统截断值法,新方法在测试集的相关系数提升至0.92,为大规模海洋生物普查提供了可推广的技术模板。未来可扩展至珊瑚礁、海草床等复杂生态系统的监测,推动"AI+生态学"的范式革新。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号