FusionDenoNet:基于沙漏结构的新型深度学习框架在医学影像噪声抑制中的创新应用
《Biomedical Signal Processing and Control》:FusionDenoNet: A novel hourglass-based deep learning framework for enhanced noise reduction in medical imaging
【字体:
大
中
小
】
时间:2025年10月21日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
本文提出FusionDenoNet这一创新性沙漏结构深度学习框架,通过多阶上下文聚合模块(Moga Block)和索贝尔注意力模块(Sobel Attention Block)的协同作用,显著提升低剂量CT(LDCT)图像的去噪性能。该模型在梅奥数据集上实现了33.6836 dB的峰值信噪比(PSNR)和0.9185的结构相似性(SSIM),在保持参数效率的同时展现出卓越的边缘保护能力,为医学影像处理提供了新的技术路径。
我们的核心创新在于设计了专用于低剂量CT(LDCT)去噪的沙漏结构框架FusionDenoNet,该框架通过多阶上下文聚合模块(Moga Block)实现全局与局部特征的互补捕获,并结合索贝尔注意力模块(Sobel Attention Block)动态增强边缘信息。实验证明,本模型在多个公开数据集上均达到最先进的性能水平。
如图2所示,架构包含K级编码器和解码器阶段,每级由多个FusionAggr模块串联构成。这些模块整合了两个关键组件:Moga模块和索贝尔注意力模块,用于捕获跨空间与通道维度的全面上下文特征。其集成处理过程可数学表达为:
FFusionAggr(x) = x + FFFN(FSobel(FMoga(x) + x) + FSobel(x))
本节列出使用的语言与工具:Python、PyTorch和CUDA。
数据集: 采用公开临床LoDoInd数据集和2016年NIH-AAPM梅奥诊所低剂量CT挑战赛数据集。该数据集包含来自10名匿名受试者的2378对低剂量与正常剂量CT扫描,层厚为3.0毫米。测试数据选取患者L506的特定切片。
为评估LDCT图像去噪性能,我们使用官方代码重新训练所有对比模型。图5-8展示了腹部CT图像的视觉对比结果。如表2所示,FusionDenoNet在L506数据集上取得了最优定量指标,其峰值信噪比(PSNR)和结构相似性(SSIM)均显著优于现有模型。
通过消融实验探究各模块对网络性能的影响:"无Moga模块(w/o MB)"和"无索贝尔注意力模块(w/o SAB)"的模型在梅奥数据集上进行训练。由表8和图12可知,移除任一模块均会导致去噪性能显著下降,验证了各组件的必要性。
本文通过在梅奥数据集和LDCT-and-Projection-data数据集上的对比实验证明,新型去噪网络能有效从噪声LDCT图像中恢复高质量NDCT图像。尽管CNN与Transformer模型在计算机视觉应用中各具优势,但在处理高维数据或需实时响应的临床场景中仍面临计算挑战。
尽管FusionDenoNet在多个数据集上表现出卓越的去噪性能,仍存在若干局限:首先,模型严重依赖配对的LDCT-NDCT数据集进行监督训练,而这类数据因CT扫描仪原始数据获取困难及伦理限制难以大量获得,可能限制模型的泛化能力。
本文提出一种基于多阶上下文聚合的方法,用于从噪声LDCT测量值中恢复高质量图像。FusionDenoNet模型利用沙漏架构实现新型FusionAggr模块,这些模块专门设计用于解决全局与局部图像信息提取的挑战。通过强调空间与通道维度间常被忽视的交互作用,模型能够提取更全面、更具区分度的特征表征。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号