FiVOS:基于交互式视频目标分割与滤波增强的鱼类分割算法

【字体: 时间:2025年05月19日 来源:Computers and Electronics in Agriculture 7.7

编辑推荐:

  为解决水产养殖场景中现有深度学习视频分割方法忽视帧间动态关联、IVOS 易因数据稀缺等导致误差累积和掩码丢失问题,研究人员开展 FiVOS 方法及鱼类数据集研究,结果达 SOTA 性能,为鱼类行为研究提供技术支持。

  在水产养殖规模不断扩大的背景下,精准高效监测鱼类行为对提升养殖效率、减少经济损失愈发关键。传统人工观测等方法在数据采集效率和准确性上存在显著局限,且可能影响鱼类健康。计算机视觉与深度学习技术的兴起,为鱼类特征信息提取提供了高效无创的解决方案。然而,现有基于深度学习的水产养殖视频分割方法常忽略视频帧间的动态关联,交互式视频目标分割(IVOS)虽能以较少用户交互实现高精度分割,但在水产养殖中的应用受限于数据稀缺,且因鱼类同类间高相似性,在长序列传播中易出现误差累积和掩码丢失,还面临 “灾难性遗忘” 问题,难以在复杂养殖环境中持续保持高精度。
为应对这些挑战,国家数字渔业创新中心的研究人员开展了相关研究,提出一种改进的交互式视频目标分割方法 FiVOS,并构建了两个鱼类专用数据集。实验表明,FiVOS 在鱼类视频分割任务中实现了最先进(SOTA)性能,为鱼类行为研究提供了有力的技术支撑。该研究成果发表在《Computers and Electronics in Agriculture》。

研究中用到的主要关键技术方法包括:设计掩码块滤波器,用于早期检测和纠正传播过程中错误的掩码块;采用基于规则的阈值方法,提高滤波精度;将噪声滤波器序列化,进一步消除错误掩码噪声;构建包含 1350 个鱼类实例静态图像的 Fish-static 数据集和 23 个图像序列的伪动态数据集,均提供像素级掩码注释。

数据集采集


研究人员在国家数字渔业创新中心采集实验数据,使用配备 48MP 主摄像头、支持 60FPS 4K 视频录制和光学防抖的智能手机,在不同光照和水生条件下拍摄清晰稳定的视频。实验用 tank 为直径 1.5 米、深 0.4 米的圆形亚克力 tank,提供稳定可控的环境。

实验配置


实验分为三个阶段。第一阶段独立训练 “Scribble To Mask” 模块,加载 deeplabv3plus_resnet50 预训练权重以加速模型拟合。第二阶段训练 “Mask Propagation” 模块,分两步进行。

方法的鲁棒性


为验证 FiVOS 方法的鲁棒性,在更复杂场景下进行额外实验,采集包含 150 条养殖鱼的真实水产养殖活动视频数据集,分别应用于基线模型(MiVOS)和 FiVOS 模型,结果显示 FiVOS 表现更优。

结论


针对现代水产养殖中因高同类相似性导致难以提取特定目标鱼类表征信息的问题,研究提出 FiVOS 方法。通过设计掩码块滤波器,采用灵活硬处理方式,预计算水产养殖数据集中掩码块的最大质心距离并设为滤波器阈值,计算距离以检测和纠正错误掩码块,结合噪声滤波器消除残留噪声,有效缓解了同类高相似性导致的误差累积问题,提高了模型在复杂环境中的分割性能和鲁棒性,为智能水产养殖管理中鱼类行为和健康状态的识别与分析提供了新工具,对水产养殖的自动化、精准化发展具有重要意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号