
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于改进YOLOv7的复杂环境下野生蝙蝠高效检测方法WB-YOLO及其生态监测应用
【字体: 大 中 小 】 时间:2025年06月06日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
为解决复杂自然栖息地中蝙蝠检测的遮挡和背景干扰问题,研究人员提出基于改进YOLOv7的WB-YOLO方法,集成Vision Transformer编码器、可变形卷积和混合注意力机制,在安徽野生蝙蝠数据集中实现94.7%的mAP,为生态监测与疾病防控提供高效解决方案。
蝙蝠作为生态链中的关键物种,既是农业害虫的天敌,又是SARS冠状病毒等病原体的自然宿主。然而,野生蝙蝠常栖息于洞穴、岩缝等复杂环境,群体活动导致图像严重遮挡,传统人工监测效率低下,红外与声学技术又受成本与环境干扰限制。安徽研究团队通过改进YOLOv7框架,开发出WB-YOLO模型,显著提升复杂场景下的蝙蝠检测精度,相关成果发表于《Engineering Applications of Artificial Intelligence》。
研究采用三大关键技术:1) 基于安徽多地采集的野生蝙蝠图像数据集(含4019标注样本),应用多种数据增强;2) 在YOLOv7中引入Vision Transformer(ViT)编码器增强全局特征,结合可变形卷积优化局部特征;3) 设计混合注意力机制(Hybrid Attention)同步捕捉空间与通道信息。实验使用NVIDIA RTX 3090 Ti显卡,以640×640分辨率输入,对比Faster R-CNN、YOLOv5等模型。
图像采集与增强:通过航拍与智能手机宏拍摄获取安徽芜湖、宣城等地蝙蝠图像,采用翻转、裁剪等增强技术解决样本不足问题。
模型优化:ViT编码器将特征图分割为16×16块处理,可变形卷积模块适应蝙蝠不规则形态,改进的空间金字塔池化(SPP)结构减少35%计算量。
性能验证:WB-YOLO在测试集达到90.7%精确度与89.0%召回率,mAP较基线YOLOv7提升20.7%,对遮挡样本检测效果提升尤为显著。
讨论与结论:尽管模型参数量增加,但推理速度仍满足实时监测需求。该研究首次将ViT与可变形卷积结合用于野生动物检测,为蝙蝠种群动态监测提供自动化工具,未来可通过轻量化设计适配边缘设备。研究获得国家自然科学基金(61871412)等资助,代码已在GitHub开源。
生物通微信公众号
知名企业招聘