《Computer Vision and Image Understanding》:Statistical-driven adaptive data augmentation for single-domain generalized object detection
编辑推荐:
这篇论文聚焦于计算机视觉领域的单源域泛化目标检测难题,针对现有数据增强技术在处理中会损伤前景语义信息的问题,提出了创新的解决方案。作者们引入了统计驱动的自适应分段映射方法和动态异质域扰动生成器,在数据层面进行自适应的、以统计特征为驱动的图像增强,在模拟多种域偏移的同时,有效保留了关键前景特征,从而在未见的目标域上实现了更强的模型泛化性能,在多项数据集的严酷场景中取得了显著的性能提升。
Highlights
• 在领域泛化(domain generalization) 的背景下,我们引入了一种与静态策略截然不同的、新颖的动态数据增强方法SDAPM(Statistical-driven adaptive piecewise mapping, 统计驱动自适应分段映射)。我们的方法开创性地将统计策略整合到数据增强中,解决了影响模型泛化能力的关键数据层面因素。通过深入分析,我们指出了现有方法的一些局限性,包括统一的增强策略和源数据语义降级,这些都严重制约了检测器的泛化能力。
• 在我们的动态方法基础上,我们进一步提出了DHDPG(Dynamic heterogeneous domain perturbation generator, 动态异质域扰动生成器),它能在多个维度上对图像进行变换。通过生成多样化的异质域扰动而不损害语义信息,DHDPG模拟了现实世界的变化,使模型能够学习与场景无关的目标特征。我们的方法在包含各种复杂场景的数据集上进行了综合评估。实验结果表明,所提出的方法展现出了出色的性能,特别是在两大更具挑战性的数据集——多天气数据集和CityScapes-C数据集的严重损坏场景中,其表现远超传统方法。
Overview
在本节中,我们将介绍所提出的图像增强框架的具体实现细节。这个框架包含两个主要组件:SDAPM和DHDPG。基于整个框架,我们将图像增强过程定义如下:
T(I) = clip(((I - μ)/σ) * σmult+ μ, ?) + ?
其中σmult是自适应拉伸因子,?是像素值范围,? 表示经过随机扰动增强后的图像特征分布。我们提出了SDAPM方法用于实现自适应的图像映射处理。
Datasets
我们在Wu和Deng (2022)构建的五个多天气数据集以及Michaelis等人 (2019)提出的CityScapes-C基准数据集上进行了实验。这五个数据集对应五种不同的天气条件,即白天-晴朗、白天-有雾、黄昏-下雨、夜晚-晴朗和夜晚-下雨。白天-晴朗场景被用作源域,包含19,395张训练图像和8,313张测试图像。其中,其余四个场景被视为在训练阶段不可见的目标域,用于评估模型的泛化能力。
Conclusion
在这项研究中,我们通过提出一种集成了统计特征驱动的自适应策略的新型数据增强框架,来应对单源域泛化目标检测的挑战。我们的方法引入了两个核心组件:统计驱动自适应分段映射(SDAPM)和动态异质域扰动生成器(DHDPG),它们协同工作,在保留源域语义完整性的同时,增强了模型应对复杂域偏移的鲁棒性。SDAPM通过分析图像的统计特征,对图像进行智能分段和自适应映射,以突出关键语义信息。而DHDPG则能动态模拟各种现实世界扰动因素,帮助模型学习更本质的、与场景无关的特征。实验表明,该方法在多个严苛场景下的目标检测任务中,相较于基线方法取得了显著的性能提升,证明了其在提升模型泛化能力方面的有效性。