
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自适应全局感知与多尺度特征融合的高效鱼类计数方法及其在水产管理中的应用
【字体: 大 中 小 】 时间:2025年06月12日 来源:Aquacultural Engineering 3.6
编辑推荐:
针对水产养殖中鱼类重叠、尺度变化及复杂背景噪声导致的计数难题,研究人员提出融合多尺度特征感知模块(MFPM)、自适应全局感知模块(AGPM)和边缘激励模块(PEM)的CNN框架。实验表明,该模型在鲤鱼计数数据集(CCD)和密集草鱼数据集(DGCD)上平均准确率达94.76%和96.96%,MAE/RMSE低至2.64/3.58,为智能渔业管理提供创新解决方案。
在水产养殖领域,鱼群数量的精准统计直接关系到生产效益与生态平衡。然而,传统人工计数方式不仅耗时耗力,还会引发鱼类的应激反应;而现有图像处理方法在复杂场景下表现欠佳——光照变化、鱼体重叠、背景噪声等问题长期困扰着研究者。更棘手的是,鱼类游动导致的尺度变化和遮挡现象,使得基于阈值分割或传统机器学习(如HOG+SVM)的方法难以稳定输出结果。尽管深度学习中的检测法(如YOLO v4+DeepSORT)和回归法有所突破,但前者易漏检重复计数,后者则无法定位个体位置。密度图方法虽展现潜力,却仍受限于特征提取能力不足导致的边缘信息丢失和背景干扰。
针对这些瓶颈,来自中国的研究团队在《Aquacultural Engineering》发表了一项创新研究。他们设计了一个名为MAPN的计数模型,其核心由三大模块构成:通过四路不同膨胀率空洞卷积捕获多尺度特征的MFPM模块、利用行列自适应池化增强遮挡区域关注的AGPM模块,以及采用双卷积并行结构强化边缘特征的PEM模块。研究采用鲤鱼计数数据集(CCD)和密集草鱼数据集(DGCD)进行验证,前者通过1920×1080像素摄像机垂直拍摄养殖水面获得,后者则专门针对高密度场景构建。
关键技术包括:1)基于VGG16前10层的主干特征提取;2)多尺度空洞卷积网络(膨胀率1/3/5/7);3)通道特征交互的全局感知机制;4)边缘特征重加权技术。实验环节不仅进行了消融研究验证各模块贡献,还与Faster R-CNN、CSRNet等主流方法进行横向对比。
研究结果
密度图可视化分析
模型生成的密度图通过热力图直观反映鱼群分布,高密度区呈红色,低密度区显蓝色。结果显示MAPN预测的密度图与真实分布高度吻合,尤其在鱼体重叠区域仍能准确区分个体。
定量性能评估
在CCD数据集上,模型MAE(平均绝对误差)和RMSE(均方根误差)分别达到2.64和3.58,显著优于对比模型。对于更复杂的DGCD数据集,平均计数精度高达96.96%,证明其在极端密集场景下的稳定性。
模块有效性验证
消融实验表明:单独移除MFPM会使MAE上升21.6%,证实多尺度特征对解决鱼体尺寸差异的关键作用;AGPM的缺失导致遮挡场景误差激增34.7%;而PEM的加入使边缘特征识别率提升18.2%,有效抑制了水纹反光等背景干扰。
结论与展望
该研究通过三大创新模块的系统整合,首次实现了复杂养殖环境下鱼类计数精度与鲁棒性的双重突破。MFPM模块成功解决了因拍摄角度导致的尺度变化问题;AGPM模块通过通道信息交互显著提升了对遮挡目标的识别能力;PEM模块则开创性地利用并行卷积结构增强边缘特征,将背景噪声干扰降至最低。技术层面,该方法将空洞卷积的跨感受野特性与注意力机制有机结合,为生物量智能监测提供了新范式。
实际应用中,该模型已展现直接经济效益——精确计数帮助养殖者优化投喂策略,预计可降低5-7%的饲料浪费。未来若结合无人机航拍技术,有望进一步扩大在海洋牧场等大尺度场景的应用。正如作者Yiying Wang和Dashe Li在讨论部分强调的,这项研究不仅为水产管理提供了可靠工具,其模块化设计思路更为其他生物量统计领域(如浮游生物监测)提供了可迁移的技术框架。
生物通微信公众号
知名企业招聘