PointOOD:基于点监督的遥感目标检测方法,该方法结合了典型特征融合和动态半径采样技术

《Digital Signal Processing》:PointOOD: Point-Supervised Remote Sensing Oriented Object Detection via Canonical Feature Fusion and Dynamic Radius Sampling

【字体: 时间:2025年10月24日 来源:Digital Signal Processing 3

编辑推荐:

  点监督远程传感目标检测中,提出PointOOD方法:1)设计FOFM模块融合多级特征提升分类概率图质量;2)开发DRAM动态调整正样本半径以优化样本分配;3)采用t-SNE替代PCA确定目标方向与边界。实验表明该方法在DOTA v1.0/1.5/2.0数据集上mAP50分别提升1.97%/1.55%/1.64%,显著优于基线及SOTA方法。

  在当前快速发展的科技背景下,遥感技术的应用日益广泛,尤其是高分辨率的航空和卫星图像,这些图像蕴含着丰富的潜在信息。随着遥感数据量的指数级增长,传统的遥感目标检测方法面临着前所未有的挑战。尤其是对于具有特定方向的目标检测,由于需要精确标注旋转边界框(RBox),手动标注过程既繁琐又耗时,严重限制了检测算法的广泛应用和发展。因此,开发一种高效、低成本的遥感定向目标检测方法成为研究的重点。

点监督定向目标检测(Point-supervised Oriented Object Detection, PointOOD)作为一种新兴的技术,为解决上述问题提供了新的思路。该方法的核心理念是利用中心点标注替代传统的RBox标注,从而减少人工干预,提高检测效率。本文提出了一种全新的PointOOD方法,旨在通过优化特征融合和动态半径调整机制,提升定向目标检测的准确性和泛化能力。

首先,针对传统方法在特征融合过程中存在的信息丢失问题,本文设计了一种名为“特征优化融合模块”(Feature Optimization Fusion Module, FOFM)的创新结构。FOFM通过引入多级扩张卷积与典型相关分析(Canonical Correlation Analysis, CCA)相结合的机制,实现了不同层级特征的有效融合。这种融合方式不仅保留了特征的多样性,还通过统计依赖性建模提升了特征表示的质量。FOFM的引入使得生成的类别概率图(Class Probability Maps, CPM)更加精确,从而为后续的伪标签生成提供了高质量的基础。

其次,为了克服传统固定半径标注方法在正负样本分配上的局限性,本文提出了“动态半径调整机制”(Dynamic Radius Adjustment Mechanism, DRAM)。DRAM的核心思想是根据目标的尺寸和局部密度动态调整正样本区域的半径,从而在不同密度的场景中实现更精确的样本选择。这种方法能够有效减少高密度区域中的样本重叠,同时避免低密度区域中可能出现的误检问题,从而显著提升检测的准确性。

此外,本文还引入了一种基于t-SNE的非线性降维方法,用于确定目标的方向和边界。与传统的主成分分析(PCA)方法相比,t-SNE能够更好地捕捉数据中的非线性结构,从而在复杂背景下更准确地识别目标的主方向和边界特征。这一创新方法为定向目标检测提供了更可靠的方向信息,有助于提高检测结果的鲁棒性。

为了验证所提出方法的有效性,本文在多个公开数据集上进行了广泛的实验,包括DOTA v1.0、v1.5和v2.0。DOTA数据集是遥感图像目标检测领域的重要基准数据集,涵盖了多种类型的目标,如飞机、船舶、棒球场、桥梁、车辆和风力涡轮机等,适用于小目标检测任务。实验结果表明,PointOOD在这些数据集上的平均精度(mAP50)分别提升了1.97%、1.55%和1.64%,显著优于现有的基线方法和最先进的技术。这充分证明了FOFM和DRAM在提升伪标签质量和最终定向目标检测性能方面的有效性。

本文的主要贡献可以归纳为以下几个方面。首先,提出了一种基于点监督的定向目标检测方法PointOOD,该方法无需繁琐且资源密集的RBox标注,仅需中心点标注即可实现定向检测。其次,设计了一种新颖的特征优化融合模块(FOFM),该模块通过多级扩张卷积与典型相关分析的结合,有效提升了特征融合的质量,从而生成更精确的类别概率图。第三,引入了动态半径调整机制(DRAM),该机制能够根据目标的尺寸和局部密度动态调整正样本区域的半径,显著优化了正样本的选择过程,提高了检测的准确性。第四,通过在多个数据集上的实验验证了PointOOD的优越性,证明了所提出方法在伪标签生成和定向目标检测方面的有效性。

在实现过程中,本文采用了一种全卷积且轻量化的混合局部通道注意力机制(Mixed Local Channel Attention, MLCA)来增强模型的特征提取能力。MLCA机制能够更有效地处理大规模图像,确保生成的类别概率图具有足够的准确性,从而为后续的伪标签生成提供可靠的基础。同时,为了提高模型的泛化能力和解释性,FOFM还通过统计依赖性建模减少了特征表示中的冗余,提升了模型的鲁棒性。

动态半径调整机制(DRAM)的引入是本文的另一项重要创新。传统方法中,正样本区域的半径通常是固定的,这在面对不同密度和尺寸的目标时可能会导致样本选择不准确。DRAM通过分析目标的尺寸和局部密度,动态调整正样本区域的大小,从而在不同场景中实现更精确的样本分配。这种方法不仅减少了高密度区域中的样本重叠,还避免了低密度区域中可能出现的误检问题,显著提升了检测的准确性。

在确定目标方向和边界方面,本文采用了一种基于t-SNE的非线性降维方法。与传统的PCA方法相比,t-SNE能够在更复杂的背景条件下捕捉到目标的主方向和边界特征,从而为定向目标检测提供更可靠的方向信息。这一方法的引入使得PointOOD能够在多种场景下实现更精确的目标定位和方向识别,进一步提升了检测性能。

此外,本文还探讨了点监督定向目标检测的潜在应用场景。随着遥感技术的发展,定向目标检测在多个领域具有重要的应用价值,包括遥感图像分析、零售场景分析和场景文本检测等。通过减少标注成本,PointOOD有望在这些领域中发挥更大的作用,推动相关技术的进一步发展和应用。

综上所述,本文提出了一种基于点监督的定向目标检测方法PointOOD,通过优化特征融合和动态半径调整机制,有效提升了检测的准确性和泛化能力。实验结果表明,该方法在多个数据集上的表现优于现有方法,验证了其在遥感图像分析中的应用潜力。未来的研究方向可以包括进一步优化特征融合策略,探索更高效的动态半径调整方法,以及拓展PointOOD在其他应用场景中的适用性。通过不断改进和创新,点监督定向目标检测技术有望在实际应用中发挥更大的作用,为遥感数据的高效利用提供强有力的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号