基于轻量化混合ViT-YOLO模型的笼养鸭行为识别研究:应对多变光照条件的智能监测方案

【字体: 时间:2025年09月06日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  为解决笼养鸭行为监测中光照变化大、目标遮挡严重等难题,Gong Yujin团队开发了轻量化CD-ViT-YOLO模型。该模型融合动态重参数增强模块(DRE)与高效视觉Transformer(EfficientViT-m0),在自建DuckBehaviour数据集上实现97.4% mAP@0.5和88.6% mAP@0.5:0.95的识别精度,参数量降低32%,为智能化家禽健康管理提供新范式。

  

在现代化家禽养殖领域,笼养鸭的行为监测直接关系到动物福利与生产效率。然而,传统人工观察方法效率低下,而现有智能监测技术面临三大挑战:多变光照条件下鲁棒性不足、密集群体中遮挡目标识别困难,以及水禽行为研究数据匮乏。尤其当鸭群在狭窄笼舍中活动时,翅膀伸展(spreading)、理羽(preening)等细微行为极易因相互遮挡或光线变化导致误检。针对这些痛点,华南农业大学Gong Yujin团队在《Smart Agricultural Technology》发表研究,提出创新性解决方案——CD-ViT-YOLO模型,为笼养鸭的精准行为监测开辟新路径。

研究团队采用多学科交叉技术路线:首先构建包含5,700张图像的DuckBehaviour数据集,涵盖6类典型行为;随后基于YOLOv5s框架,通过三阶段创新实现模型优化:(1)设计动态重参数增强模块(Dynamic Re-parameterised Enhancement, DRE),采用DCNv4(可变形卷积)替代原C3模块,提升对不规则目标的特征提取能力;(2)引入阶段定制化EfficientViT-m0作为骨干网络,通过轻量化多尺度线性注意力机制降低45%计算复杂度;(3)开发难度感知检测头(Difficulty-Aware Detection Head, DAD),通过类别难度嵌入向量缓解样本不平衡问题。

数据采集与处理

在华南农业大学动物营养与饲料科学观测站的自建鸭舍中,采用1920×1080分辨率摄像机连续两天记录90日龄笼养鸭行为,通过帧提取与清洗获得5,700张有效图像。标注工作采用边界框标注法,定义饮水(drinking)、躺卧(lying)等6类行为,构建五折交叉验证数据集。针对光照变化,研究将环境划分为充足光(300-500 lux)、中等光(50-200 lux)和不足光(20-50 lux)三种条件。

模型架构创新

核心改进体现在三方面:DRE模块通过IRRep-Bottleneck结构与分层聚合路径,有效解决密集鸭群中的特征融合难题;EfficientViT-m0骨干采用2:2:4:3的阶段比例分配,在减少15.8 GFLOPs运算量的同时保持全局感知能力;DAD头部通过MLP生成的难度分数向量,使稀少行为(如spreading)的mAP@0.5:0.95提升4.1%。

性能验证

在DuckBehaviour数据集上,CD-ViT-YOLO以4.75M参数量实现97.4% mAP@0.5,较基线YOLOv5s提升1.1个百分点。特别在不足光照条件下,躺卧行为检测精度达98.8%,显著优于传统方法。可视化热图显示,新模型能更精准聚焦鸭体关键部位,背景干扰响应减少37%。跨数据集测试表明,在公开牛只行为数据上仍保持93.7% F1-score,展现良好泛化性。

这项研究的突破性在于首次将轻量化ViT与YOLO框架深度融合应用于水禽行为监测。相比接触式传感器方案,非侵入式的CD-ViT-YOLO系统既避免动物应激反应,又能实现每秒77帧的实时处理,为大规模养殖场提供可行解决方案。作者在讨论部分指出,未来可通过时序建模进一步区分"饮水"与"啄食"等易混淆行为,并探索边缘设备部署方案。该成果不仅填补了笼养鸭智能监测的技术空白,其提出的DRE模块和阶段自适应ViT架构,也为其他农业场景下的密集目标检测提供了普适性方法论。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号