Foc_YOLOXn_ASFF:实现高精度与轻量化的水下鱼类检测与识别新突破

【字体: 时间:2025年04月22日 来源:Aquacultural Engineering 3.6

编辑推荐:

  在水产养殖中,手动处理水下视频繁琐易错,现有深度学习算法在模型大小和检测精度上难以平衡。研究人员开展基于改进 YOLOX-nano 算法的水下鱼类检测研究,提出 Foc_YOLOXn_ASFF 方法,提升了 AP,能满足嵌入式设备应用需求。

  在水产养殖蓬勃发展的当下,水下观测成为了养殖户们的 “眼睛”。借助水下摄像头,人们能够实时观察养殖鱼类的状态,为科学管理和精准养殖提供依据。然而,大量的水下视频数据处理却成了令人头疼的难题。人工处理不仅耗时费力,还容易出错,而且需要专业技术人员操作。这就促使人们寻找更高效的自动处理方法,深度学习算法因此走进了人们的视野。
在深度学习领域,基于卷积神经网络(CNN)的算法在鱼类检测和识别方面取得了不少进展。但现有的算法仍存在诸多问题,比如两阶段目标检测算法(如 Fast R-CNN 和 Faster R-CNN)虽然精度较高,但检测速度慢,难以满足实时检测的需求;而一阶段算法(如 YOLO 系列)虽速度快,但在处理小物体或成群物体时精度欠佳,并且容易学习到大量无意义的背景样本,导致类别不平衡问题。此外,现有的模型很难在模型大小和检测精度之间找到完美的平衡,无法很好地应用于水下观测平台这类计算资源有限的设备。

为了解决这些问题,来自国内的研究人员开展了一项关于水下鱼类检测和识别的研究。他们提出了一种基于改进 YOLOX-nano 算法的方法,即 Foc_YOLOXn_ASFF。研究人员通过一系列实验,在自己构建的水下鱼类数据集上进行测试,最终得出了令人瞩目的成果。该研究成果发表在《Aquacultural Engineering》上,为水产养殖智能化发展提供了有力支持。

研究人员在此次研究中运用了多种关键技术方法。首先,利用高分辨率(1920×1080 像素)、30 帧 / 秒帧率的超广角水下摄像头(ROS-C600HD)采集大量视频数据,这些数据来自海洋养殖场的长期监测。然后,在深度学习服务器(配备 Intel (R) Xeon (R) CPU E5–2678 v3 @ 2.50?GHz 和 GeForce RTX 2080 Ti GPU)上进行实验,所有模型均训练 180 个 epoch,并设置 5 个 epoch 的热身阶段。

下面来看看具体的研究结果:

  • 数据集准备:研究人员使用超广角水下摄像头(ROS-C600HD)收集了大量视频数据,其分辨率为 1920×1080 像素,帧率 30,且借助水下 LED 照明可用于夜间拍摄。这些摄像头安装在水下观测平台,对海洋养殖场进行长期监测,为后续研究提供了丰富的数据支持。
  • 算法改进与性能提升:研究人员将 Focal loss 替代原始 YOLOX 中的二元交叉熵(BCE)损失来训练目标分支,缓解了背景和前景类别的不平衡问题,使检测性能从 0.846 AP 提升到 0.869 AP,且未增加模型复杂度。同时,结合 YOLOX-nano 与自适应空间特征融合(ASFF)结构,更好地融合多尺度特征,进一步将 AP 提升到 0.877。Foc_YOLOXn_ASFF 仅含 2.27 M 参数,相比 YOLOv5n 和 SE_YOLOv5s_DGhost,AP 分别高出 1.2% 和 7.9%。

研究结论和讨论部分指出,Foc_YOLOXn_ASFF 有效解决了类别不平衡和特征尺度不一致导致的漏检和误检问题。该方法通过 Focal loss 突出难区分但有价值的样本,借助 ASFF 缓解多尺度特征的冲突,在模型大小和检测精度上达到了理想平衡,满足了嵌入式设备的实际应用需求,为水产养殖的智能化发展提供了新的技术方案,有助于推动水产养殖行业朝着更加高效、精准的方向发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号