基于深度学习模型的骑乘马匹情绪状态解码:多模态特征融合与模型可解释性研究

【字体: 时间:2025年04月24日 来源:Scientific Reports 3.8

编辑推荐:

  本研究针对骑乘马匹福利评估缺乏自动化工具的难题,创新性地结合HGS和RHpE双标注体系,通过YOLOv8x和Faster R-CNN构建头部/身体裁剪数据集,采用VGG16/Xception迁移学习与模型堆叠技术,实现87%准确率的情绪分类。LIME解释模型发现其关注特征与专家标注高度一致,为马术运动伦理规范提供了AI驱动的客观评估范式。

  

论文解读

马术运动中骑乘马匹的福利问题日益受到关注,但传统评估方法存在显著局限。专家需通过视频逐帧分析马匹的耳朵姿态(如向后贴附表示不适)、眼部肌肉紧张度、尾巴摆动等特征,这种人工标注不仅耗时(单次分析需数小时),且存在主观偏差(需双人独立验证)。更棘手的是,关键指标如"头部垂直位后置(head-behind-the-vertical)"的细微差异难以肉眼判断,而研究表明这种姿势与皮质醇水平升高直接相关。尽管已有研究尝试用AI识别马匹疼痛(如基于Horse Grimace Scale的75.8%三分类准确率),但针对骑乘状态的动态评估仍属空白。

法国农业食品与环境研究院(INRAE)的Romane Phelipon团队在《Scientific Reports》发表的研究,首次将多模态深度学习应用于骑乘马匹情绪解码。研究团队构建了1036张图像数据集(546舒适/490不适),涵盖250+品种马匹在盛装舞步、障碍赛等场景下的骑乘状态。通过创新性融合HGS(马匹疼痛表情量表)和RHpE(骑乘马疼痛行为量表)双标注体系,系统标注了耳部位置、眼部张力等5类关键特征。

关键技术包括:(1)采用YOLOv8x和Faster R-CNN分别创建马体/头部裁剪数据集;(2)设计四模块CNN基础架构(含批量归一化与L1/L2正则化);(3)基于Hyperopt库进行贝叶斯超参数优化(批大小8-32、学习率0.01-0.0001);(4)对VGG16/Xception等7种预训练模型进行微调(解冻最后卷积层);(5)使用LIME/SHAP/Grad-CAM三种可解释性方法验证特征重要性。

研究结果

预处理
分辨率增强(256×256)与数据增强(旋转/错切等)使基础模型准确率提升4%。头部裁剪数据集表现最优(70.48%准确率),尽管缺失尾部特征,但聚焦面部细节的特性使其优于身体裁剪数据集(66.65%)和原始数据集(63.59%)。

模型性能
Xception在256×256分辨率下取得76.97%测试准确率。模型堆叠策略(VGG16+Xception)使头部数据集性能达到峰值:准确率87%、召回率97%(意味着几乎不漏诊舒适状态)。值得注意的是,模型对"轻微头部后置"案例仍判定为舒适,暗示其能像专家一样评估超屈曲程度。

模型解释
LIME在识别关键特征方面最具一致性:

  • 舒适预测:聚焦闭合口腔(权重79%)与耳部前倾
  • 不适预测:检测到眼部肌肉紧张(权重68%)与耳部后贴
    SHAP和Grad-CAM还发现模型会关注骑手手部动作(如缰绳张力),这与马匹应激研究结论吻合——缰绳压力会导致心率升高与冲突行为。

结论与意义
该研究首次证明深度学习可有效解码骑乘马匹复杂情绪状态,其87%的准确率显著优于前人工作(Corujo等2021年的65%)。模型不仅复现了专家标注特征(如耳部位置),还自主发现骑手操控等新关联因素。研究存在的局限性(如静态图像缺乏动态信息)为未来指明方向:开发视频分析系统、建立全球解释框架、集成生理参数(如心率)多模态评估。这项成果为马术行业提供了客观的福利监测工具,对促进"马匹友好型"骑乘规范具有重要实践价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号