DGAA:基于振幅对齐的领域泛化
《Biomedical Signal Processing and Control》:DGAA: Domain Generalization with Amplitude Alignment
【字体:
大
中
小
】
时间:2025年11月09日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
医学图像分割中基于FFT的幅度分布对齐方法通过分离相位和幅度成分,利用提出的幅度对齐网络消除不同领域数据的分布差异,实验表明该方法在MRI前列腺分割和眼底图像杯盘分割等基准数据集上显著优于现有方法。
近年来,深度学习在医学图像分割领域取得了显著的进展。然而,大多数已取得的成果都是基于一个相对简单的场景假设,即源域和目标域的数据分布是完全一致的。然而,这一假设在现实中并不成立,因为将现有的方法直接应用于临床场景时,往往会导致模型性能的大幅下降。现有的应对分布偏差的方法包括数据增强、元学习等,但这些方法并未明确区分和处理不同数据域之间的相似性和差异性,从而限制了模型的泛化能力。为了缓解数据处理过程中相似性和差异性之间的相互干扰,我们采用了一种更先进的方法,利用快速傅里叶变换(FFT)来分离数据的相似性(相位)和差异性(振幅)成分。随后,我们通过我们提出的振幅对齐网络对振幅部分进行独立处理,该网络直接对源域和目标域中的所有数据的振幅分布进行对齐。这种方法有效地消除了振幅中存在的域偏移现象。在多个基准数据集上的综合实验表明,我们的方法能够有效泛化到未知的域,并超越现有的最先进方法。代码可在以下链接中获取:https://github.com/butterflyGN/DGAA。
深度学习的持续发展推动了医学图像分割技术的自动化进程。当前,大多数分割方法都基于一种简化的假设,即训练数据和测试数据的分布是相同的。然而,在真实的临床环境中,医学图像往往来自不同的医疗机构,并且在不同的采集条件下使用多样化的成像设备进行采集。尽管对这些数据进行了统一的预处理,但由于其来源多样,处理后的图像仍然表现出显著的统计特性差异,从而导致数据分布之间的显著变化,这种现象通常被称为域偏移。因此,当模型在特定数据集上训练后,面对未知的目标域数据时,其性能往往会急剧下降。此外,缺乏标注数据以及医疗机构之间数据共享的困难是实际应用中常见的限制因素。这些限制阻碍了旨在提升模型性能的策略的有效实施,例如增加数据量或训练针对特定域的模型。因此,研究如何增强模型在目标域上的泛化能力变得尤为重要。
在本文中,我们遵循域泛化(Domain Generalization, DG)的基本原则,深入研究了域偏移的主要发生位置以及如何尽可能地缓解域偏移现象。域偏移主要体现在两个方面:(1)图像中的对比度和背景差异,以及(2)分割对象的形状和外观差异。前者主要是由于在不同的采集条件下获取的图像数据在背景和对比度方面存在显著差异,而后者则主要归因于个体患者的差异,例如年龄和地理因素。为了进一步说明这一问题,我们在图1中展示了背景和对比度不一致以及形状和外观不一致的数据。如图1所示,红色标注的区域代表真实标签的位置。从左到右的前两张图像可以看出,两幅图像之间存在显著的亮度和对比度差异。此外,每个样本的标签显示出不同患者之间腺体的大小和外观存在明显变化。为了应对域偏移问题,一种直观的解决方案是集成学习,即将针对特定域设计的多个模块整合到一个统一的框架中进行学习。近年来,一些学者提出了将源域中的域特异性先验知识嵌入模型中,以增强其泛化能力。然而,由于不同来源的数据共享相同的任务,其特征表现出显著的相似性,因此这种方法完全忽略了不同域数据之间的相关性,导致模型参数数量急剧增加。此外,模型的泛化能力上限受到源域数量的严格限制,使得其在数据有限的新临床中心中难以应用。一些研究者引入了快速傅里叶变换(FFT)到域泛化领域,试图通过简单地交换源域数据的振幅来合成新的数据分布,从而提高模型的泛化性能。然而,这种方法引入了过多的随机性,给可重复性带来了困难,并且在复现过程中需要大量的时间。此外,模型的泛化能力上限仍然受到源域分布类型的影响。
在本文中,我们提出了一种振幅分布对齐网络,用于统一不同域数据的振幅分布,从而解决医学图像在未知目标域中的分割任务。如前所述,现有的模型忽略了域偏移的主要发生位置,未能对域数据之间的相似性和差异性进行区分处理,导致模型在目标域上的性能下降。因此,通过研究域偏移的主要发生位置,并利用傅里叶变换分别处理域数据之间的相似性和差异性,我们旨在通过尽可能减少域数据之间的差异,同时保留共享的任务相关特征,来缓解域偏移现象。经过快速傅里叶变换后,图像被分解为携带高级语义的相位成分和代表低级语义的振幅成分。由于所有来源的数据都共享相同的分割任务,它们的高级语义具有高度的相似性,而域偏移(差异)主要体现在低级语义的振幅成分中。这种方法能够去除一些导致域偏移的元素,同时保留共享的任务相关特征,从而减少域数据之间的分布差异,提升模型的泛化能力。与以往的FFT方法相比,我们的方法具有以下几个显著优势:(1)它在不引入超参数或随机性的情况下,对包含差异信息的振幅图像的分布进行对齐,从而显著提升模型的可重复性,减少训练时间成本,并稳定模型的泛化能力。(2)通过对源域和目标域振幅分布进行对齐,它克服了由于简单交换源域振幅所生成的新分布与目标域分布之间差异过大而导致的模型泛化能力下降问题。(3)以往的FFT方法在源域数量少于目标域数量时,由于简单交换生成的分布类型存在局限,导致模型性能显著下降。而我们的方法能够对源域和目标域的振幅分布进行对齐,不受源域和目标域数量关系的影响。
综上所述,本文的主要贡献包括以下几个方面:
首先,我们提出了一种新的有效方法,通过对域之间的振幅分布进行对齐,消除域之间振幅统计信息的差异,从而提升模型在未知目标域上的分割性能。这种方法能够有效应对域偏移现象,为医学图像分割提供了一种新的思路。
其次,我们提出的振幅分布对齐网络能够识别不同域之间的振幅差异特征,并通过基于域的标签进行去除。这种方法能够有效消除域之间的差异,从而提升模型在目标域上的泛化能力。
第三,我们在多个基准数据集上的综合实验表明,我们的方法在性能上优于现有的域泛化方法。实验结果充分证明了该方法的有效性。
最后,我们的方法为医学图像域的通用分割提供了新的和有效的解决方案,不仅适用于少数分割任务,而且不限于特定的图像模态。这种方法具有良好的扩展性和应用前景。
在医学图像分割方面,随着深度学习技术的不断发展,基于深度学习的分割方法在分割精度、形状感知以及复杂对象分割方面逐渐展现出优势。全卷积网络(Fully Convolutional Networks, FCNs)的引入极大地推动了语义分割的发展,随后,卷积神经网络在医学图像分割领域的应用也迅速加快。然而,由于FCNs对图像细节的感知能力有限,往往导致分割结果较为粗糙。为了进一步提升分割效果,研究者引入了更先进的网络结构,如U-Net及其变种,这些结构能够更好地捕捉图像的上下文信息和空间关系,从而提升分割精度。然而,这些方法在面对域偏移问题时仍然存在一定的局限性,特别是在处理不同域之间的差异性特征时,未能有效区分和对齐相似性和差异性成分,导致模型在目标域上的性能下降。
为了更好地应对域偏移问题,我们提出了一种基于振幅分布对齐的网络结构,该结构能够有效区分和对齐不同域之间的相似性和差异性成分。具体来说,我们采用快速傅里叶变换(FFT)将图像分解为相位成分和振幅成分,其中相位成分携带高级语义信息,而振幅成分则代表低级语义信息。由于所有来源的数据都共享相同的分割任务,它们的高级语义具有高度的相似性,而域偏移主要体现在低级语义的振幅成分中。因此,通过分别处理这些成分,我们能够有效去除导致域偏移的元素,同时保留共享的任务相关特征,从而提升模型在目标域上的泛化能力。我们的方法不仅能够有效减少域数据之间的分布差异,还能够提升模型的稳定性,使其在面对未知域数据时仍能保持较高的分割精度。
此外,我们的方法在处理域偏移问题时具有以下几个显著优势。首先,它能够有效对齐包含差异信息的振幅图像分布,而不引入超参数或随机性,从而显著提升模型的可重复性,减少训练时间成本,并稳定模型的泛化能力。其次,通过同时对源域和目标域的振幅分布进行对齐,我们的方法能够克服由于简单交换源域振幅所生成的新分布与目标域分布之间差异过大而导致的模型泛化能力下降问题。第三,与以往的FFT方法相比,我们的方法不受源域和目标域数量关系的影响,能够更有效地对齐不同域之间的振幅分布,从而提升模型在不同域上的泛化能力。
在实验部分,我们使用了多个公开的医学图像数据集,包括磁共振成像(MRI)中的前列腺分割数据集和视网膜图像中的视盘/视杯分割数据集。这些数据集分别来自四个不同的临床中心,涵盖了不同的采集条件和成像设备。为了确保实验的公平性和有效性,我们对这些数据进行了统一的预处理步骤。首先,我们采用中心裁剪的方法,将图像裁剪为800 × 800的视盘区域,随后将其调整为384 × 384的尺寸作为网络的输入。最后,我们应用了Min-Max归一化方法,以确保数据的标准化处理。这些预处理步骤能够有效减少不同域数据之间的分布差异,从而提升模型的泛化能力。
在实验过程中,我们对提出的振幅分布对齐网络进行了全面的评估。实验结果表明,该方法在多个基准数据集上的表现优于现有的域泛化方法。特别是在前列腺分割和视杯/视盘分割任务中,我们的方法在未知域上的分割精度显著提升。这表明,我们的方法能够有效应对域偏移问题,并在实际应用中展现出良好的性能。此外,我们的方法在处理不同域之间的差异性特征时,能够保持较高的分割精度,而不会因为域之间的差异而导致性能下降。
为了进一步验证我们的方法的有效性,我们进行了大量的对比实验。实验结果显示,我们的方法在保持相同分割任务的前提下,能够有效减少域之间的差异性特征,从而提升模型的泛化能力。与传统的域泛化方法相比,我们的方法在处理不同域之间的差异性特征时,能够更有效地对齐振幅分布,从而提升模型在目标域上的性能。此外,我们的方法在处理不同域之间的差异性特征时,能够减少模型的训练时间成本,并提高模型的稳定性。
在实际应用中,医学图像分割面临着许多挑战,包括域偏移问题、数据标注的困难以及不同医疗机构之间的数据共享问题。为了应对这些挑战,我们的方法提供了一种新的解决方案,即通过振幅分布对齐来减少域之间的差异性特征,从而提升模型的泛化能力。这种方法不仅能够有效应对域偏移问题,还能够提升模型在不同域上的性能,使其在实际应用中更加可靠和高效。
在实验结果分析中,我们发现,我们的方法在多个基准数据集上的表现显著优于现有的域泛化方法。特别是在处理不同域之间的差异性特征时,我们的方法能够更有效地对齐振幅分布,从而减少域之间的差异性,提升模型的泛化能力。此外,我们的方法在处理不同域之间的差异性特征时,能够保持较高的分割精度,而不会因为域之间的差异而导致性能下降。
综上所述,我们的方法在医学图像分割领域提供了一种新的有效解决方案,能够有效应对域偏移问题,并提升模型在未知目标域上的泛化能力。通过振幅分布对齐,我们的方法能够减少域之间的差异性特征,同时保留共享的任务相关特征,从而提升模型的分割性能。这种方法不仅适用于少数分割任务,而且不限于特定的图像模态,具有良好的扩展性和应用前景。我们的方法在处理不同域之间的差异性特征时,能够保持较高的分割精度,而不会因为域之间的差异而导致性能下降。此外,我们的方法在处理不同域之间的差异性特征时,能够减少模型的训练时间成本,并提高模型的稳定性,使其在实际应用中更加可靠和高效。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号