《Engineering Applications of Artificial Intelligence》:Multi-objective walking sheep identification method through the back appearance and diversion channel
编辑推荐:
高效准确的羊群行走个体识别方法基于分道控制与后躯图像分析,提出MEB-YOLOv8n检测模型与CM-MViT识别模型结合的解决方案。通过分道控制减少遮挡,采用 ByteTrack 跟踪算法生成有序ID,结合Laplace方差过滤(>35)优化图像质量,最终实现99.05%识别准确率,较原模型参数减少60%,具备抗遮挡、高效率优势。
薛毅|方梅|王俊杰|沈永帅|李思怡|高峰|刘素梅|董晓|王伟伟|王奎
安徽农业大学机械与车辆工程学院,合肥,230036,中国
摘要
高效准确地识别每天进出围栏的行走中的羊只,有助于牧民获取丢失羊只的外貌信息,从而有效地进行搜索并避免草地放牧时可能发生的争执。以往的研究主要集中在计数上,但缺乏高效准确的识别方法。本研究提出了一套用于行走中羊只检测与跟踪的方法,包括背景图像序列提取、过滤和身份识别。通过引导通道将羊群分成多个有序的单列羊流。在此基础上,提出了MEB-YOLOv8n检测模型(将MobileViT、ECA(高效通道注意力)和BiFormer集成到YOLOv8n中)、背景图像提取与过滤方法,以及CM-MViT识别模型(将ECA和EMA(高效多尺度注意力)集成到MobileViT中)。对比了五种从视频中提取羊只背景图像序列的方法的性能。结果表明,与原始YOLOv8n相比,MEB-YOLOv8n模型将mAP@0.5(平均精度)提高了0.48%,参数减少了60%;从检测框中提取背景图像比从跟踪框中提取更准确,使用拉普拉斯方差进行背景图像过滤后准确率提高了1.32%;CM-MViT模型相比原始MobileViT准确率提高了1.31%。当在“1/6-5/6”屏幕范围内提取羊只背景图像时,整个方法的准确率达到99.05%。与以往的方法相比,该方法具有抗遮挡、高效和准确的优势,为建立多目标行走中羊只识别系统提供了重要支持。
引言
中国拥有世界上最大的草原面积,有超过一亿只放牧的羊。在日常放牧过程中,小群的羊经常穿过破损的围栏并与其他羊群混在一起(Wang和Guo,2014),这是不可避免的,因为广阔的牧场面积使得及时修复破损的围栏变得困难。牧民必须定期检查羊群以及时发现丢失的羊。然而,现有的技术只能检查羊群的数量,无法提供丢失羊只的外貌或身份信息,这使得牧民难以高效地寻找它们;此外,即使在其他羊群中找到了丢失的羊,也很难说服其他羊群的牧民承认这些羊属于丢失羊的牧民,这可能会导致争执。随着农业规模的扩大(Zhao等人,2020),牧民饲养的羊的数量通常超过数百只,手动检查它们的身份变得非常困难。因此,迫切需要一种能够快速准确识别返回羊只个体身份的方法。
传统的接触式识别方法,如耳部切割、烙印、耳标和射频识别(RFID),可能会对动物造成永久性伤害,并影响它们的身心健康(Mustafi等人,2021)。目前的研究热点是通过动物的生物特征(如鼻纹(Kumar等人,2018)、虹膜纹(Wildes等人,1996)、视网膜(Rusk等人,2006)和面部(Corkery等人,2007)进行非接触式身份识别。数据采集过程的复杂性和对动物配合的高要求使得鼻纹、虹膜纹和视网膜纹在实际生产条件中难以推广和应用(Wan等人,2023)。许多研究(Hitelman等人,2022;Salama等人,2019;Xue等人,2021)使用羊的面部图像来识别它们的身份,但由于羊天生活跃且头部姿势频繁变化,在无约束条件下容易发生相互遮挡(Billah等人,2022),因此很难获得理想的面部图像。一些研究尝试利用羊的多视角图像(Zhang等人,2022a)和双线性特征融合网络(Wan等人,2023)来提高识别精度。然而,这些方法需要手动控制羊,并且在没有干扰的情况下识别移动中的羊具有挑战性。总之,当前的研究主要集中在静态或低速条件下识别羊,缺乏能够快速准确识别行走中羊的方法。
薛毅等人(2024)发现,羊的背部和侧面外观在身份识别方面优于面部外观。基于此,本研究提出了以下多目标行走中羊身份识别方法:首先,使用引导通道将拥挤混乱的羊群流分离成多个有序的单列羊流,从而克服了相互遮挡和运动速度过快的影响。其次,从顶部视角捕捉羊的运动视频,并使用羊的背部外观图像作为识别标志,以避免因遮挡和消失引起的识别错误。最后,提取羊的背部图像,并使用图像识别和投票方法确定其个体身份。具体来说,本研究提出了改进的MEB-YOLOv8n模型(将MobileViT、ECA(高效通道注意力)和BiFormer集成到YOLOv8n中),作为羊的背部对象定位器,并通过ByteTrack跟踪算法和自构建的MIoU关联机制(基于IoU的最大值关联机制)准确提取每个行走中羊在指定范围内的背部图像序列。然后,使用拉普拉斯方差评估每张羊背部图像的清晰度,并移除小于设定阈值的背景图像。最后,改进的CM-MViT模型(将ECA和EMA(高效多尺度注意力)集成到MobileViT中)识别每张羊背部图像的身份,并对每张羊的背部图像序列应用投票方法来确定该序列中每只羊的个体身份。
本研究的贡献是提出了一种MEB-YOLOv8n + ByteTrack + 自构建MIoU关联机制 + CM-MViT方法,该方法在引导通道下实现了行走中羊个体身份识别的高效率和准确性。本研究的结果为开发一种快速识别羊群的方法提供了理论和技术支持,可以帮助牧民更快地找回丢失的羊并避免潜在的纠纷。
部分片段
多目标行走中羊识别方法
如图1所示,多目标行走中羊个体识别方法包括以下三个步骤。
(1)行走中羊的检测与跟踪:通过提出的MEB-YOLOv8n模型检测引导通道中的行走中羊,并通过ByteTrack跟踪算法持续跟踪,为每只行走中的羊分配一个随机识别号(ID)。
(2)羊的背部图像序列提取与过滤:对于每个ID对应的羊,提取一系列背部图像
MEB-YOLOv8n羊背部区域检测模型
所有模型的性能都在相同的测试集上进行了评估,结果如表2所示。引入所有三个模块(MEB-YOLOv8n)的模型参数减少了原始YOLOv8n模型的0.4倍,而P值和mAP@0.5分别提高了0.92%和0.48%。与仅引入C2f-ECA注意力机制和Biformer模块的模型相比,P值提高了,参数参数(Params(M)进一步减少,尽管R值和mAP@0.5也有所提高。
MEB-YOLOv8n羊检测模型
MEB-YOLOv8n羊检测模型表现优异的原因如下:首先,使用了高效的MobileViT特征提取网络模块代替了原始的骨干网络,将mAP@0.5提高了0.48%,同时将模型参数体积减少了60%。其次,构建的C2f-ECA模块使模型能够捕获更多特征,并大幅减少了对外部通道信息的关注。最后,模型对小目标特征的建模能力得到了增强。
结论
本研究提出了一种基于行走中羊背部图像的多目标个体识别方法。根据从两个实验中收集的数据、结果、分析和讨论,我们发现该方法包括羊的背部检测、跟踪、提取、过滤和识别等步骤,运行有效,准确率达到99.05%。得出的结论如下:
CRediT作者贡献声明
薛毅:撰写——原始草稿、软件、方法论、正式分析、数据管理、概念化。方梅:验证、正式分析、数据管理。王俊杰:撰写——审阅与编辑、监督、方法论、数据管理。沈永帅:撰写——审阅与编辑、监督、调查。李思怡:撰写——审阅与编辑、验证、软件、数据管理。高峰:验证、正式分析。刘素梅:调查、数据管理。董晓:监督,
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
致谢
本工作得到了安徽省自然科学基金(资助编号:2308085QC106)、安徽省教育厅(资助编号:2023AH050982、2025AHGXZK30062)、安徽农业大学校级研究项目(资助编号:rc412204)以及中华人民共和国科学技术部(资助编号:2023YFD1901004)的支持。我们感谢郑阳和李毅在实验数据收集方面的帮助。