
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于潜在扩散模型与冷扩散过程的低剂量CT快速去噪:任务优化与临床转化突破
【字体: 大 中 小 】 时间:2025年06月13日 来源:Computers in Biology and Medicine 7.0
编辑推荐:
针对低剂量CT(LDCT)图像去噪中传统深度学习方法存在的细节丢失、模型崩溃及计算效率低等问题,研究人员创新性地将潜在扩散模型(LDM)与冷扩散过程(Cold Diffusion)相结合,提出了一种高效去噪框架。该模型在潜在空间进行扩散以降低计算成本,并采用CT特异性退化方式替代高斯噪声,实验显示其PSNR/SSIM指标优于传统DDPM,训练速度提升2倍、采样速度提升14倍,为临床实时应用提供了可行方案。
在医学影像领域,计算机断层扫描(CT)虽是不可或缺的诊断工具,但其辐射暴露风险始终是悬在医患头上的达摩克利斯之剑。低剂量CT(LDCT)虽能降低辐射危害,却带来了图像噪声增加、伪影丛生的新难题,这些"视觉干扰"可能让医生错过微小病灶,犹如雾里看花。传统解决方案如卷积神经网络(CNN)和生成对抗网络(GAN)虽各有所长,却分别陷入细节模糊和模型崩溃的困境。更令人头疼的是,新兴的去噪扩散概率模型(DDPM)虽能生成高质量图像,但其"龟速"的采样过程——动辄上千步迭代、数分钟才能处理单张图像,在争分夺秒的急诊场景中简直像用牛车运送急救药品。
为破解这些难题,韩国首尔大学盆唐医院的研究团队在《Computers in Biology and Medicine》发表了一项突破性研究。他们巧妙地将潜在扩散模型(Latent Diffusion Model, LDM)与冷扩散过程(Cold Diffusion)嫁接,创造出兼顾质量与效率的LDCT去噪新范式。这项研究的精妙之处在于双管齐下:一方面通过LDM将计算密集型操作压缩到低维潜在空间,好比把高清电影转为压缩包处理;另一方面用CT特异性噪声替代传统高斯噪声,如同为去噪任务定制专属"解密钥匙"。实验数据显示,这种创新组合不仅PSNR突破性提升,更实现了14倍的采样加速,让扩散模型首次具备临床实用价值。
关键技术包括:1) 采用编码器-解码器架构进行潜在空间特征提取;2) 基于AAPM Mayo Clinic LDCT挑战赛数据集(含5936组全剂量/四分之一剂量CT配对图像)训练模型;3) 在潜在空间实施冷扩散过程,使用确定性退化算子替代随机噪声;4) 通过100例独立腹部-盆腔CT队列验证泛化能力。
【Architecture overview】
研究团队设计了两阶段架构:第一阶段训练变分自编码器(VAE)将CT图像压缩到潜在空间,保留语义特征的同时降低维度;第二阶段在潜在空间实施冷扩散,使用定制化退化算子逐步添加/去除CT特异性噪声。这种设计使得模型能专注处理医学图像特有的噪声模式,而非盲目应对随机干扰。
【Datasets】
模型训练采用NIH-AAPM Mayo Clinic LDCT挑战赛的5936组腹部CT图像(8例患者训练,2例验证),测试时额外使用100例独立腹部-盆腔CT数据。这种严格的数据划分确保了模型评估的可靠性,特别是验证了算法对不同解剖区域的适应能力。
【Conclusion】
该研究突破了扩散模型在医学影像领域的应用瓶颈:LDM将计算成本降低至临床可接受范围,冷扩散过程则通过任务适配的噪声模式将采样步骤缩减到传统方法的1/14。定量评估显示,该方法在PSNR、SSIM和RMSE三项关键指标上均超越DDPM基准,同时训练耗时减半。这些进展不仅为LDCT去噪提供了新工具,更开创了扩散模型临床落地的可行路径——当算法效率与诊断精度不再是非此即彼的选择题,医学AI才真正迈入实用化时代。
讨论部分强调,这种框架的普适性远超CT去噪本身:潜在空间操作可推广至MRI、X光等其他模态;冷扩散的任务适配特性使其在超分辨率、图像配准等领域潜力巨大。作者特别指出,未来工作将探索动态调整扩散步数的机制,就像老司机根据路况换挡,进一步优化临床场景下的实时性能。这项研究犹如在医学AI的工具箱里添了把多功能瑞士军刀,其价值或许不限于解决今天的问题,更在于开启了明天的新可能。
生物通微信公众号
知名企业招聘