
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于跨模态层次门控(HGCM)网络与音频引导注意力的水产养殖鱼类摄食行为智能分析
【字体: 大 中 小 】 时间:2025年07月26日 来源:Aquaculture International 2.2
编辑推荐:
为解决传统水产投喂依赖人工经验或机械装置导致的精度不足问题,研究人员开发了融合双向LSTM与Transformer编码器的跨模态层次门控(HGCM)网络。该模型通过音频引导注意力机制动态捕捉视觉特征,结合残差连接与多头注意力实现视听深度融合,在Pseudocaranx dentex和大菱鲆数据集上分别取得97.56%和97.61%的三分类准确率,为智能投喂管理提供了高鲁棒性解决方案。
在现代水产养殖领域,精准高效的投喂技术对提升产量、降低人力成本至关重要。传统方法受限于人工经验或机械装置的僵化控制,难以实现自适应投喂。这项研究创新性地提出跨模态层次门控网络(HGCM),其核心包含两大技术亮点:音频引导注意力模块像"声呐探测器"般动态锁定鱼群活跃图像区域,而双向LSTM与Transformer编码器组成的混合架构则如同"时空捕手",精准捕捉摄食行为的动态特征。通过残差连接、门控机制和多头注意力的协同作用,模型实现了视觉与听觉信号的深度交融。在商业化养殖场景测试中,该体系对Pseudocaranx dentex和大菱鲆的摄食强度分类准确率双双突破97.5%,即使在循环水系统的复杂噪声环境下仍保持稳定性能。这项技术为智能养殖提供了可扩展的解决方案,标志着水产管理从经验驱动向数据驱动的重大跨越。
生物通微信公众号
知名企业招聘