编辑推荐:
在无人机航拍图像中,小目标检测面临诸多难题,如目标小、视角影响大等。研究人员基于 YOLOv7 开展 DR-YOLO 研究。实验表明,与 YOLOv7 相比,DR-YOLO 在 VisDrone2019 数据集上 mAP0.5提升 14.8% ,mAP0.95提升 9.8%,有效提高检测性能。
随着科技的飞速发展,无人机在各个领域的应用越来越广泛,就像一群不知疲倦的 “空中小卫士”,在农业监测、城市规划、快递配送等诸多场景中都能看到它们忙碌的身影。在无人机的众多任务里,从航拍图像中准确检测和识别地面目标至关重要。然而,这项任务却困难重重。想象一下,无人机从高空俯瞰地面,那些原本正常大小的物体在图像中变得极小,就像一个个微小的 “芝麻粒”,不仅像素值低,能提供的特征也非常有限,而且由于拍摄视角的原因,目标尺度变化大,背景复杂得如同 “大杂烩”,物体之间还经常相互遮挡,这使得传统的目标检测算法在处理这类图像时 “力不从心”,难以准确地检测出这些小目标。
为了解决这些棘手的问题,来自国内的研究人员开展了一项关于无人机航拍场景小目标检测的研究。他们基于 YOLOv7 框架,提出了 DR-YOLO(一种改进的基于 YOLOv7 的无人机航拍场景多尺度小目标检测模型)。研究结果显示,在 VisDrone2019 数据集上,DR-YOLO 的平均精度均值(mAP)在交并比阈值为 0.5 时,相比基线 YOLOv7 提升了 14.8%,在交并比阈值为 0.95 时提升了 9.8% ,这一成果充分验证了 DR-YOLO 在无人机航拍图像目标检测中的有效性,为无人机在相关领域更精准地执行任务提供了有力支持,该研究成果发表在《Digital Signal Processing》。
研究人员在开展研究时用到了几个主要关键的技术方法。首先,设计了空间金字塔池化带空洞卷积(Spatial Pyramid Pooling with Dilated Convolutions,SPPDSPC)模块,用于增强密集目标特征提取;其次,将改进的多尺度特征融合(HTLF)模块嵌入到特征金字塔网络中,为不同尺度的检测头提供丰富的空间信息;此外,应用了解耦检测头,针对小物体重新设计检测头的数量和大小;最后,利用高斯瓦瑟斯坦距离(Gaussian Wasserstein Distance,GWD)优化回归损失。研究使用的数据集为 VisDrone2019 数据集,由天津大学机器学习与数据挖掘实验室航拍团队收集、标注和整理。
研究结果
- SPPDSPC 模块增强特征提取:研究人员提出的 SPPDSPC 结构,利用不同内核大小的连续池化操作,获得不同的感受野,并且融入空洞卷积,增强了对密集目标特征的提取能力,让模型能更好地 “抓住” 小目标的特征信息。
- HTLF 模块优化信息融合:将增强的多尺度特征融合模块 HTLF,融入到 PAFPN 特征金字塔结构中。与 v7 结构中的连接操作相比,HTLF 能更有效地将当前层信息与高级语义信息、低级细粒度细节相结合,平衡了低级特征的空间信息和高级特征的语义信息,优化了网络检测头对小物体的分类和识别。
- 解耦检测头提升小目标检测能力:针对无人机航拍图像中小物体普遍存在的情况,应用了解耦检测头,重新设计了检测头的数量和大小,增加了适合小物体尺寸范围的检测头,提高了网络对小物体检测的敏感性和感知能力。
- GWD 优化回归损失提升检测性能:采用基于瓦瑟斯坦距离的新型小目标检测评估方法 GWD,它可以在标签分配、非极大值抑制(NMS)和回归损失函数中替代交并比(IoU)。GWD 能独立于重叠度来衡量小物体的分布相似性,显著提升了检测器在小物体检测方面的性能。
研究结论和讨论
研究人员成功提出了 DR-YOLO 这一针对无人机航拍图像的多尺度目标检测模型。通过对网络架构的优化,如重新设计解耦检测头,增强了对小目标的敏感性;改进特征提取方式,增加锚框数量和密度,提升了网络对小物体的感知能力。对于密集和遮挡的小物体,借助 SPPDSPC 模块、HTLF 模块等技术手段,有效提高了检测精度。
该研究成果意义重大,DR-YOLO 的出现,为无人机在航拍场景下的目标检测提供了更精准、高效的解决方案,能够推动无人机在安防监控、交通管理、灾害监测等领域的进一步应用和发展。它克服了传统算法在处理无人机航拍图像时的诸多弊端,提升了小目标检测的准确率和效率,为相关领域的智能化发展奠定了坚实的基础。未来,有望在此基础上继续优化模型,使其在更复杂的场景中发挥更大的作用,为无人机航拍目标检测领域带来更多突破和创新。