
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于条件引导Transformer的对抗扩散模型T-CADiff在医学图像分割中的创新应用
【字体: 大 中 小 】 时间:2025年06月13日 来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
针对医学图像分割中扩散模型(Diffusion Model)存在的特征错位和全局信息利用不足问题,西安交通大学团队提出T-CADiff模型。该研究通过条件引导Transformer(CGT)模块在傅里叶空间融合原始图像语义特征与噪声特征,结合GAN对抗训练提升生成真实性。在ISIC 2016数据集上实现HD95 11.04、Dice 91.51%的突破性性能,为精准医疗诊断提供新范式。
医学图像分割是辅助疾病早期诊断的关键技术,但现有方法面临两大困境:传统CNN模型难以捕捉长程依赖关系,而基于生成对抗网络(GAN)的方法又存在模式坍塌和训练不稳定的固有缺陷。尽管扩散模型(Diffusion Model)在图像生成领域展现出卓越的多样性优势,但其在医学图像分割中的应用仍受限于特征对齐困难和全局信息利用不足等挑战。
西安交通大学的研究团队在《Biomedical Signal Processing and Control》发表的研究中,创新性地提出了T-CADiff模型。该模型通过三个核心技术突破:1) 条件引导Transformer(CGT)模块在傅里叶空间实现语义特征与噪声特征的高效融合;2) 双任务预测机制同时优化噪声预测和真实掩模重建;3) 引入GAN对抗训练框架提升生成真实性。研究采用ISIC 2016皮肤病变数据集验证,900张专业标注图像经过标准化和随机翻转等预处理后,模型在多项指标上超越现有最优模型(MedSegDiff-V2等)。
Model framework
研究构建的框架包含去噪过程、CGT模块和对抗训练三部分。通过将Transformer嵌入UNet架构,CGT模块利用自注意力机制学习全局上下文,其独特的傅里叶空间特征融合策略有效解决了语义特征与噪声特征的空间错位问题。实验表明,该设计使HD95指标降低21.3%。
Introduction of dataset and data preprocessing
采用ISIC 2016标准数据集,通过频域变换和几何增强处理,解决了医学图像样本稀缺的难题。特别设计的频谱空间对齐方法使Dice系数提升3.2个百分点。
Conclusion
该研究证实:1) 傅里叶空间特征融合能有效分离噪声与真实信号;2) 预测x0
的辅助任务可加速模型收敛;3) 对抗训练使生成掩模的解剖结构合理性提升18.7%。这些发现为扩散模型在MRI、CT等多模态医学图像分析中的应用提供了新思路。
Han Yang等作者强调,T-CADiff的创新性在于首次将频谱空间学习与条件对抗训练结合,其90.93%的灵敏度指标表明模型在微小病变检测方面具有临床转化潜力。未来工作将探索模型在乳腺肿瘤和肺结节分割中的泛化能力,并开发轻量化版本以适应移动医疗场景。
生物通微信公众号
知名企业招聘