医学图像分割是临床诊断和治疗计划中的关键技术,它能够在像素级别精确量化复杂的解剖结构和病理特征。这项技术在黑色素瘤的早期诊断和治疗中尤为重要,研究表明,及时识别病变可将患者的五年生存率提高到90%以上(Aayushman, Mittal, Chawla, Gupta, 2024; Wang, Luo, Wang, 2024b)。目前,准确的皮肤病变识别主要依赖于皮肤科医生对皮肤镜图像的手动解读。传统的手动分析方法存在效率低、主观性强和标准化不足等缺点。解读一张图像可能需要几分钟时间,且结果容易受到医生经验的影响。因此,需要一种自动化、高效且准确的图像分割方法。
深度学习的出现推动了医学图像分割的显著进步,卷积神经网络(CNN)和Transformer成为主流架构(Sahoo, Dash, Mohapatra, 2024; Zheng, Huang, Liu, Cai, 2024)。诸如U-Net及其衍生模型之类的开创性模型通过利用CNN的强大局部特征提取能力并集成多尺度模块来增强边界感知,展现了出色的效果(例如Att-UNet, PMAA-Net)(Oktay, Schlemper, Folgoc, Lee, Heinrich, Misawa, Mori, McDonagh, Hammerla, Kainz, et al., Yu, Chen, Min, Zhao, Wang, 2024b)。然而,一个根本性的限制仍然存在:这些方法通常无法充分建模病变边界的拓扑结构。由于边缘被视为一系列局部高频梯度,而不是具有连续形态的连贯实体,因此产生的分割掩膜往往边缘模糊、不连续或带有伪影,尤其是在对比度低或纹理复杂的区域。虽然后续基于Transformer的模型通过自注意力机制解决了CNN的全局上下文限制(Li, Tian, Hu, Yuan, 2024b, Zhang, Yin, Gu, Chen, 2025),但边缘仍然通常被视为需要增强的局部特征,而不是一个整体结构约束。这种方法往往导致预测缺乏拓扑完整性。相比之下,扩散模型(Shuai, Chen, Mao, Zho, & Zhang, 2024)在各种图像生成任务中展示了令人印象深刻的结果,展示了在条件和无条件数据分布建模方面的强大能力。基于扩散模型的方法整合了创新技术,包括小波变换、边界增强、注意力机制、多模态建模和两阶段处理,在许多医学图像分割任务中实现了最先进的性能。
然而,大多数现有的扩散模型将掩膜生成视为一个条件过程,其中源图像指导从纯噪声开始的逆向扩散。这种间接机制可能难以弥合图像和分割图之间的领域差距,从而限制了模型的泛化能力。此外,它们缓慢的训练速度、漫长的推理时间和较低的准确性阻碍了它们在需要即时反馈的交互式临床工作流中的应用。同时,它们对随机噪声采样的依赖性带来了不确定性,影响了可重复性和医学可靠性。
为了解决平衡分割精度、拓扑连贯性和计算效率的上述挑战,我们提出了WBDM-ECRF,这是一个专为精确快速皮肤病变分割设计的新框架。据我们所知,这是第一个将桥扩散模型(BDM)应用于这一特定领域的框架。BDM(Wang, Xiao, He, Glide-Hurst, & Dong, 2024a)不是从噪声生成掩膜,而是直接从源图像域学习到目标掩膜域的随机变换,从而从根本上加快了生成过程。我们的框架首先使用小波变换来增强输入空间中的病变结构特征,为扩散过程提供了一个更稳健的起点。为了进一步增强边界定义和结构完整性,我们引入了一种新的高效条件随机场(ECRF)模块作为后处理步骤。通过将分割视为概率图模型的能量最小化问题(Zhao, Chen, Cao, Zhao, & Liu, 2024),ECRF明确地建模了像素之间的关系,从而确保最终的分割既精确又在拓扑上连贯。具体来说,我们的贡献如下:
•据我们所知,这是首次将桥扩散模型(BDM)框架成功应用于皮肤病变分割任务。通过将分割视为直接的图像到掩膜变换,我们的模型显著提高了推理效率,同时保持了高精度,为基于扩散的方法树立了新的标杆。
•我们提出了一种新的高效条件随机场(ECRF)模块,该模块在其势函数中加入了结构相似性指数(SSIM),从而能够捕捉更丰富的边界细节并强制实现拓扑连贯性。
•我们在三个广泛使用的基准数据集上进行了广泛的实验。结果表明,我们的方法显著优于基线模型,并超越了最先进的分割算法。
本文的其余部分结构如下。第2节回顾了相关工作,并分析了这些方法与我们的方法之间的差异。第3节详细介绍了我们模型的结构,并对我们的方法进行了深入解释。第4节检验了在各种数据集上的实验结果和消融研究。最后,第5节总结了我们的研究。