本文介绍了Cross Hard Negative Mining(Cross-HNM)方法,该方法将跨站点的误检测结果重新利用为硬负样本,用于构建适用于多个领域的施工现场物体检测模型。通过训练针对不同站点的子模型来提取其他站点的误检测结果,Cross-HNM利用跨站点之间的结构特征来抑制数据集特有的噪声。在11个站点和5个未见过测试站点上的评估显示,单个Cross-HNM模型的平均精度(mAP)达到了57.58%,其性能与不使用推理开销的6倍集成方法相当。利用Ben-David界限进行的理论分析阐明了跨站点负样本如何减少领域差异以及泛化误差的上限。通过2D敏感性分析和LS-CC方法确定了最优阈值。该方法的性能提升可以转移到包括YOLOv11、Faster R-CNN和DETR在内的多种架构上。由于数据挖掘和LS-CC过程是离线的,因此最终检测器的运行时间保持不变。因此,Cross-HNM为在多样化和未见过的环境中实现智能施工现场安全监控提供了一种实用且可扩展的解决方案。
在本节中,我们阐述了Cross Hard Negative Mining(Cross-HNM)的理论有效性,并在此基础上提出了一个具体框架,该框架规范了跨站点误检测样本的挖掘过程及其在领域变化下的集成方法,以实现鲁棒的泛化。
实验
为了评估通过Cross Hard Negative Mining生成的负标签的有效性,我们进行了一系列实验。这些实验旨在与传统方法进行比较,并调整Cross Hard Negative Mining的参数,例如阈值和置信度阈值,以最大化挖掘到的负标签的影响。
结论
本文提出了一种用于施工现场物体检测的Cross Hard Negative Mining方法。Cross-HNM实现了跨站点的硬负样本监督,与仅挖掘数据集内部样本的通用硬负样本挖掘方案相比,Cross-HNM明确利用了多站点之间的结构特征,区分了特定于领域的模式和数据集特有的噪声,并将这种设计与基于LS-CC的简单阈值选择策略相结合。它在检测过程中使用了一个显式的负样本处理模块