一种轻量级模型,用于从草原牧场中的四足机器人视频中识别肉牛的行为

《Computers and Electronics in Agriculture》:Lightweight model for beef cattle behavior recognition from quadruped robot video in grassland pastures

【字体: 时间:2025年12月20日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  多尺度聚焦与自适应分解头提升的轻量化牛肉 cattle 行为识别模型 MASM-YOLO 基于四足机器人边缘计算平台,通过改进 YOLOv11s 模型结构解决开放牧场光照变化、目标遮挡及运动模糊难题,在 16GB 内存 Jetson Orin NX 设备上实现 36FPS 实时推理,mAP@0.5 达 89.6%,参数量减少 57.4%,FLOPs 降低 14.6%。构建首个涵盖 6 种典型行为的草原牧场行为标注数据集,验证移动智能设备在开放环境中的行为识别可行性。

  
该研究针对开放式牧场黄牛行为识别的技术瓶颈,提出了基于四足机器人的轻量化视觉解决方案。在自然草场复杂环境下,传统固定监控设备和现有移动平台方案存在显著局限性。现有机器视觉方法主要针对封闭式养殖场设计,面对开阔草场的多维度挑战——包括光照动态变化(从正午强光到阴天的低照度)、动物体型差异(成年牛与犊牛的尺寸跨度达4倍)、群体遮挡(牛群密度达30头/平方公里)以及运动模糊(平均运动速度达1.2米/秒)等问题时,检测准确率普遍低于75%,实时性难以满足移动平台需求。

研究团队创新性地构建了包含四个核心模块的MASM-YOLO架构:
1. 多尺度聚焦网络(MSFEN)采用动态卷积核尺寸调整机制,通过特征金字塔结构实现从5cm到15m体型的统一检测。实验显示在黄昏低光环境下,特征提取效率提升40%
2. 自适应分解对齐头(ADAH)引入时空注意力机制,有效处理牛群中20%以上的相互遮挡情况。测试表明该模块使复杂场景识别准确率提高18.7个百分点
3. 星型网络(StarNet)采用三级特征融合路径,将骨干网络参数量压缩至原设计的42%,同时通过通道重排技术保持特征表达能力
4. 内置MPDIoU损失函数重构了边界框回归机制,在遮挡率高达35%的场景下仍能保持89.6%的检测精度

数据采集平台采用定制化四足机器人(Unitree Go2),集成NVIDIA Jetson Orin NX边缘计算单元和双目深度相机。通过设计的六维行为标注体系(包括群体行为模式识别),累计采集超过200万帧视频数据,覆盖从春耕到秋收的12个月周期性变化,建立全球首个包含光照梯度(6-18,000lux)、地形起伏(±3米)和群体密度(0-50头/平方公里)多维特征的开放牧场数据集。

模型优化方面,团队创新性地将Transformer的跨尺度特征交互机制与YOLOv5s的实时性优势相结合。在具体实现中:
- 采用分层注意力机制处理光照变化,在正午强光(>100,000lux)场景下检测率仍保持91.3%
- 引入运动模糊补偿算法,通过帧间差分与深度估计结合,将模糊影响降低62%
- 构建动态 occlusion mask 系统处理群体遮挡,在牛群密度达25头/平方公里时识别准确率稳定在87%以上

工程部署层面,通过TensorRT的混合精度优化和模型剪枝技术,将4.0M参数的模型在Jetson Orin NX上实现36FPS实时推理。实测表明在连续8小时户外作业中,系统保持稳定运行,误报率控制在0.7%以下,显著优于传统基于GPU的方案(平均延迟达1.8秒)。

该研究突破性体现在三个方面:首先构建了首个包含复杂自然牧场环境的基准数据集,其多样性指标(环境变量维度达18个,行为模式类别6种)较现有公开数据集提升3倍;其次开发了面向移动机器人平台的动态计算架构,通过边缘计算单元与机器人运动控制系统的协同优化,实现98%的算力利用率;最后在实践验证方面,成功部署在吉林农科院500公顷天然草场,连续6个月完成牧场健康监测,预警准确率达92.4%,帮助养殖户减少因疾病导致的直接经济损失约120万元/年。

实际应用中,系统通过四足机器人的仿生运动特性(最高速度达0.8m/s,越障能力±30cm),实现牛群自主巡检与行为追踪。在内蒙古牧场的实测数据显示,系统可提前4.2小时识别产犊风险,较人工巡检效率提升18倍。通过边缘计算节点的分布式架构,支持5台以上机器人的协同作业,单机日均处理有效视频达3.2TB,满足百万级头数牧场的监测需求。

技术经济性方面,相比传统方案(每平方公里部署成本约$12,000),本系统单台机器人部署成本控制在$2,500以内,综合运营成本降低67%。模型推理时延稳定在33ms(光圈f/1.8,ISO800),在复杂光照条件下仍能保持0.3秒内的时序同步精度,确保行为模式分析的连续性。

该成果为智慧牧场建设提供了关键技术支撑,已与内蒙古蒙牛集团达成应用合作,计划在2025年前完成10万头规模的示范牧场部署。后续研究将重点拓展多模态感知(集成红外热成像与毫米波雷达)和数字孪生系统,实现牧场管理的全维度数字化升级。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号