基于深度学习的野猫身体部位识别:解决相机陷阱图像中个体识别的创新方法

【字体: 时间:2025年06月06日 来源:Ecological Informatics 5.9

编辑推荐:

  针对澳大利亚野猫威胁本土物种的生态问题,研究人员创新性地采用基于身体部位(flank/body、legs、tail)的深度学习模型ResNet-50,通过特征拼接(feature concatenation)技术,解决了相机陷阱图像中因遮挡或局部视角导致的个体识别难题。研究发现猫的侧腹(body)最具鉴别力,模型准确率达92%,为野生动物保护提供了高效非侵入性监测工具。

  

在澳大利亚,野猫(Felis catus)的捕食行为已导致至少20种本土哺乳动物濒危或灭绝。传统标记重捕法不仅成本高昂,还会对动物造成伤害。尽管相机陷阱技术能非侵入性地捕捉野猫影像,但图像质量差、姿态多变、局部遮挡等问题严重制约了基于深度学习的个体识别。此前研究多依赖单一特征(如面部或全身),而野外环境中动物姿态不可控,亟需一种能整合多部位特征的灵活识别方法。

为解决这一难题,研究人员利用澳大利亚维多利亚州Glenelg和Otway地区相机陷阱采集的1644张野猫图像(10只个体),创新性地提出基于身体部位的特征拼接模型。研究聚焦四个部位:侧腹(body)、后腿(back leg)、前腿(front leg)和尾巴(tail),通过ResNet-50架构提取特征并拼接,对比不同部位组合的识别效能。

关键技术方法

  1. 数据预处理:从15,881张原始图像中筛选10只个体,平衡样本量,水平翻转右视角图像统一为左视角;
  2. 特征提取:采用预训练ResNet-50(去除顶层)分别提取四个部位的2048维特征向量;
  3. 模型构建:通过早期融合(early fusion)将多部位特征拼接后输入全连接层分类;
  4. 对照实验:测试单部位、三部位(排除一种)及双部位组合的识别准确率。

研究结果

3.1 初始训练结果

  • 单部位性能:侧腹(body)识别准确率最高(91%),显著优于后腿(85%)、前腿(79%)和尾巴(75%),验证其作为关键鉴别特征的价值。

3.2 特征拼接模型效能

  • 全部位组合:准确率达92%,与单用侧腹相当,但训练时间缩短至4分钟(无特征提取层反向传播);
  • 排除实验:排除后腿时性能不变(92%),而排除侧腹则显著下降至88%,凸显侧腹的不可替代性。

3.3 关键部位贡献

  • 双部位组合:前腿+后腿组合表现最佳(92%),而侧腹+尾巴仅85%,表明肢体运动可能携带个体特异性信息;
  • 单部位对比:仅用侧腹的准确率(92%)接近全组合,证实其作为核心识别依据的可靠性。

讨论与意义
该研究首次系统评估了野猫多部位特征对个体识别的贡献,提出三点创新价值:

  1. 生态应用:侧腹的高鉴别力指导相机陷阱布设策略,如通过诱饵(如Paton et al.提出的视觉引诱)引导动物展示侧身姿态;
  2. 技术优化:特征拼接模型虽未超越单部位ResNet-50,但其处理局部遮挡的灵活性(如仅靠腿部或尾巴识别)更适合复杂野外场景;
  3. 方法论启示:早期融合(early fusion)在9/11案例中优于晚期融合(late fusion),为多模态生态数据整合提供新思路。

局限性包括未测试其他CNN架构(如VGG或YOLOv5)和数据增强技术的影响。未来研究可结合生成对抗网络(GAN)合成稀缺姿态样本,或采用视觉Transformer(ViT)挖掘部位间空间关联。这项发表于《Ecological Informatics》的成果,不仅为野猫种群监测提供了可扩展方案,其“分而治之”的策略对其它隐蔽性野生动物的识别具有普适参考价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号