基于深度学习的声学目标分类模型在鱼类调查估算中的应用与评估

【字体: 时间:2025年05月26日 来源:ICES Journal of Marine Science 3.1

编辑推荐:

  推荐 为解决传统声学-拖网调查中人工标注耗时且主观性强的问题,挪威海洋研究所研究人员开发了基于U-Net架构的深度学习框架,用于北海小沙鳗的调查数据自动化分类。通过对比三种模型(基线模型、深度感知模型及相似性采样模型)与官方数据的差异,发现模型可减少60%以上人工标注工作量,但需动态调整阈值以优化精度。该研究为渔业资源评估提供了高效、可重复的分析工具,显著提升了声学数据处理效率。

  

论文解读
研究背景与问题提出
科学声学-拖网调查(acoustic-trawl survey)是监测鱼类和浮游动物种群动态的核心工具,其数据被广泛用于渔业资源评估模型。然而,传统方法依赖人工标注声学目标分类(ATC),不仅耗时且易受主观因素影响。随着多频回声仪(echosounder)数据的爆炸式增长,自动化分类技术成为迫切需求。尽管已有机器学习(ML)方法被提出,但其预测结果能否直接融入渔业调查流程仍缺乏系统性验证。

研究机构与方法
挪威海洋研究所团队基于U-Net架构开发了三种深度学习模型:基线模型、融合深度信息的改进模型,以及通过相似性采样增强训练的模型。研究整合了2009至2024年北海小沙鳗(Ammodytes marinus)的调查数据,采用阈值分割策略将模型输出的SoftMax概率图转化为二值分类结果,并通过StoX软件将预测数据嵌入传统调查估算流程。

关键方法

  1. 数据预处理:将原始声学数据(.raw文件)与LSSS系统标注数据转换为Zarr格式,实现三维网格化存储。
  2. 模型架构:基于U-Net的像素级语义分割框架,结合深度信息(如水深)和相似性采样策略优化训练数据分布。
  3. 阈值设定:通过最大化F1分数确定各模型训练年份的最优阈值,并采用中位数阈值进行跨年份预测。

研究结果
模型性能对比

  • 基线模型:对表层浮游生物的误分类导致2009年和2024年估算值显著偏离官方数据,暴露其对背景噪声的敏感性。
  • 深度感知模型:通过引入水深信息,减少了底层信号污染,整体表现更接近人工标注结果。
  • 相似性采样模型:在训练年份表现优异,但因阈值设置不当(如2021年阈值过低),导致部分鱼群内部结构被遗漏。

整合分析
将模型预测的NASC(单位面积散射系数)输入StoX后,发现自动化流程估算的生物量与官方数据总体一致,但年度间波动较大。例如,2019年基线模型的PSU(初级采样单元)最大误差达2700 m2/nmi2,源于表层浮游生物的错误分类(图7c)。

讨论与意义
研究表明,尽管深度学习模型可减少人工标注负担,但需动态调整阈值以适应数据分布变化(如鱼群大小和分布的季节性差异)。作者提出“人工校验+模型迭代”的混合策略,即先通过模型生成初步分类结果,再针对不确定性区域进行人工修正。该方法可将标注效率提升50%以上,同时保证估算精度。此外,框架兼容性广,可扩展至多物种或中层鱼类调查,为全球渔业资源管理提供了标准化技术路径。

结论
本研究首次系统验证了深度学习在声学目标分类中的实际应用价值,证实了自动化流程在减少人力成本方面的潜力。未来需进一步开发自适应阈值算法,并探索多模态数据融合(如环境参数与拖网样本)以提升模型鲁棒性。该框架标志着渔业声学数据分析从人工时代向智能化时代的跨越。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号