重新思考医学图像分割中的高强度训练样本生成方法
《Pattern Recognition》:Rethinking Hard Training Sample Generation for Medical Image Segmentation
【字体:
大
中
小
】
时间:2025年10月08日
来源:Pattern Recognition 7.6
编辑推荐:
张量轮分解结合并行矩阵分解与组平滑性正则化用于高光谱图像缺失像素恢复,提出TWC-PMFGS方法,通过分析张量展开与轮因子间的秩关系增强全局信息捕获能力,并利用梯度域的组稀疏特性提升模型鲁棒性,实验表明在10%采样率下性能提升达3.65 dB。
近年来,随着图像采集技术的不断发展,多维数据在现实生活中的应用越来越广泛。在这些数据中,高光谱图像(HSIs)因其丰富的光谱信息而成为环境监测、医学成像、军事应用等多个领域的重要工具。然而,由于传感器故障、设备老化或无线通信传输损失等因素,HSIs在实际应用中常常会遇到随机像素丢失的问题,这直接影响了后续处理任务的准确性。为了从有限的局部观测中恢复缺失的像素,低秩张量补全(LRTC)技术被广泛研究并应用于HSIs的恢复任务中。
在实际应用中,HSIs通常具有较强的结构相关性,因此对应的张量往往呈现出低秩特性。利用这种低秩特性,张量分解成为LRTC中一种强大的工具。目前常用的张量分解方法包括CANDECOMP/PARAFAC(CP)分解、Tucker分解以及张量奇异值分解(t-SVD)。然而,CP分解和Tucker分解在建模时忽略了各因子之间的联系,限制了其对HSIs全局结构的捕捉能力。相比之下,t-SVD虽然能够产生较为理想的补全结果,但其应用需要选择特定的张量模式下的变换方式,这一过程往往依赖于对数据集的深入理解,因此在实际操作中存在一定的困难。
为了解决上述问题,研究者们开始关注张量网络(Tensor Networks, TNs)的结构特性。张量网络是一种用于表示高维数据的紧凑结构,它能够有效捕捉数据的内在关系。其中,张量列车(Tensor Train, TT)分解和张量环(Tensor Ring, TR)分解是两种具有代表性的张量网络结构。TR分解可以视为TT分解的一种扩展,其结构更为灵活,能够更好地表示低秩张量。然而,TR分解的环结构仅建立了相邻因子之间的关系,未能充分考虑所有TR因子之间的内部关联,从而限制了其在HSIs恢复中的表现。随后,Zheng等人提出了一种全连接张量网络(Fully-Connected Tensor Network, FCTN),它通过在任意两个因子之间建立连接,进一步增强了模型的表达能力。但FCTN的超参数数量随张量阶数的增加而呈二次增长,这使得在高阶张量中选择最优的FCTN秩变得困难,影响了模型的分解精度。
为克服这些限制,Wu等人提出了一种名为张量轮(Tensor Wheel, TW)的新型张量网络结构。TW分解将一个N阶张量表示为一个N阶核心张量和多个小规模的环因子,这些环因子按照轮状拓扑结构排列。在这一框架下,相邻的环因子之间存在相互关系,而所有环因子则通过核心张量进行连接,从而能够捕捉非相邻因子之间的复杂相互作用。这种轮状结构相比其他张量网络格式,能够更有效地描述张量的全局相关性。此外,TW分解的超参数数量随张量阶数呈线性增长,这为处理高阶数据提供了便利。基于TW结构,Wu等人提出了一个TW补全模型,并结合了近端交替最小化算法进行优化。随后,Wang等人开发了三种专门针对TW模型的随机算法,并进一步提出了快速且稳健的基于奇异值分解(SVD)的算法,以提高模型的数值稳定性。尽管这些TW补全算法在HSIs恢复中表现出良好的性能,但它们仍然对秩的选择较为敏感,这在一定程度上限制了模型的可扩展性。
为了解决这一问题,近年来一些研究者尝试通过引入因子正则化策略来增强模型的鲁棒性。例如,Yuan等人提出了一种新的张量环补全方法,通过在TR的潜在空间中施加矩阵核范数正则化,从而提升了模型的性能稳定性。同样,Yu等人对FCTN的因子施加了低秩约束。此外,一些研究从张量子空间的角度出发,进一步在因子中施加稀疏性约束,以提高模型在较大秩选择下的鲁棒性。同时,一些研究还尝试利用梯度因子的低秩特性来增强模型的稳定性。例如,Wu等人在梯度域中利用了TR因子的低秩性和稀疏性;Zheng等人则利用低秩矩阵分解对FCTN的梯度因子进行了建模,并引入了Tikhonov正则化以增强图像的局部连续性。这些方法的核心思想在于,通过在潜在因子空间中施加低秩约束,可以有效地限制原始张量的展开秩,从而提升模型的鲁棒性。
然而,对于TW分解而言,其因子与原始张量展开之间的秩关系尚未得到充分研究。这种研究的缺乏不仅限制了TW分解在HSIs全局相关性捕捉方面的能力,也阻碍了模型鲁棒性的进一步提升。此外,现有的因子正则化技术未能有效利用HSIs中固有的分组平滑特性,导致在恢复具有显著结构特征的图像时存在一定的困难。为解决这些问题,本文提出了一种基于张量轮结构的并行矩阵分解与分组平滑先验相结合的张量补全方法,简称TWC-PMFGS。该方法的核心贡献在于以下几个方面:
首先,我们通过利用原始张量展开与TW因子之间的秩关系,对所有TW环因子进行并行矩阵分解。这种方法不仅增强了TW分解在捕捉HSIs全局相关性方面的能力,还显著提升了模型对秩选择的鲁棒性。传统的TW补全方法通常需要手动设定秩参数,这在实际应用中可能因参数选择不当而导致补全效果不佳。而通过引入并行矩阵分解,我们能够在不依赖于人工设定秩的情况下,更自然地提取张量的潜在结构信息,从而提高模型的自适应性和泛化能力。
其次,我们观察到HSIs在梯度域中呈现出分组稀疏性特征,并进一步证明了这一结构可以通过TW因子进行有效表达。基于这一发现,我们在梯度因子上施加了?2,1范数正则化。?2,1范数是一种常用的稀疏性约束手段,它能够同时捕捉数据中的局部和全局结构特征。通过在梯度因子中引入这种正则化,我们不仅能够有效利用HSIs中的分组平滑特性,还能在一定程度上抑制噪声干扰,提高补全图像的质量。此外,?2,1范数的引入使得模型在处理具有复杂结构的HSIs时更加稳定,减少了因秩选择不当而导致的误差累积。
最后,我们设计了一种高效的交替方向乘子法(Alternating Direction Method of Multipliers, ADMM)算法,用于求解TWC-PMFGS模型。该算法在保证计算效率的同时,能够有效收敛到最优解。通过在六幅HSIs和七幅多光谱图像(MSIs)上进行广泛的实验验证,我们的方法在视觉和定量评估指标上均表现出优越的性能。实验结果表明,即使在采样比仅为10%的情况下,TWC-PMFGS方法仍能实现高达3.65 dB的性能提升。这一结果不仅证明了我们方法的有效性,也表明其在低采样率下的鲁棒性较强,具有良好的实际应用前景。
在本文的后续部分,我们首先介绍了论文中使用的符号和基础概念,包括张量的基本定义、张量轮分解的结构以及张量补全的基本模型。接着,我们详细阐述了TWC-PMFGS方法的理论基础和优化算法。在理论部分,我们通过定理1推导了原始张量展开与TW因子之间的秩关系,并基于此提出了并行矩阵分解的策略。在优化算法部分,我们设计了一种高效的ADMM算法,以求解TWC-PMFGS模型。随后,我们通过大量的实验结果,验证了TWC-PMFGS方法在HSIs和MSIs补全任务中的有效性,并回答了四个关键问题:我们的方法与现有最先进的张量补全方法相比如何?低秩因子分解和分组平滑正则化在提升模型性能方面有多大的作用?TWC-PMFGS方法在时间成本方面如何与现有方法相比较?以及参数设置对模型性能有何影响?
通过实验验证,我们发现TWC-PMFGS方法在多个数据集上均优于其他方法,尤其是在低采样率下表现尤为突出。这一优势主要归因于我们对TW因子的并行矩阵分解和对梯度因子的?2,1范数正则化。这些改进不仅提升了模型的鲁棒性,还增强了其对HSIs中结构特征的捕捉能力。此外,我们还对模型的计算效率进行了评估,结果显示TWC-PMFGS方法在保持高性能的同时,具有较低的计算成本,适合大规模数据的处理。
综上所述,本文提出了一种基于张量轮结构的并行矩阵分解与分组平滑先验相结合的张量补全方法,即TWC-PMFGS。该方法在理论和实践层面均展现出显著的优势,不仅能够有效捕捉HSIs的全局相关性,还能在低秩选择下保持较高的补全质量。实验结果表明,TWC-PMFGS方法在多个数据集上的表现优于现有方法,尤其是在低采样率下仍能实现较高的性能提升。这些成果为HSIs的补全任务提供了新的思路和方法,具有重要的理论和应用价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号