编辑推荐:
在乳腺 X 光图像诊断中,噪声干扰影响癌症检测。研究人员开展了基于 Transformer 模型的乳腺 X 光图像去噪研究。结果显示,DeepTFormer 模型在去噪性能上优于其他方法。这一成果有助于提高乳腺 X 光图像质量和癌症诊断准确性。
在医学领域,乳腺 X 光检查是乳腺癌早期检测的重要手段。然而,在实际应用中,乳腺 X 光图像常常受到各种噪声的干扰,如盐和胡椒噪声、泊松噪声、斑点噪声以及高斯噪声等。这些噪声不仅降低了图像的质量,还使得细微的病变特征难以被识别,尤其是微钙化(MCs,直径在 0.1 - 1mm 的小钙沉积物),这对于放射科医生来说是一个巨大的挑战,因为微钙化是乳腺癌的早期指标之一 。传统的去噪方法,如维纳滤波器、中值滤波器和高斯滤波器等,虽然在一定程度上能够减少噪声,但效果并不理想。因此,开发一种更有效的乳腺 X 光图像去噪方法迫在眉睫。
SRM 科学技术学院(SRM Institute of Science and Technology)的 A. Robert Singh 等人开展了相关研究。研究团队提出了一种名为 DeepTFormer 的新型去噪网络架构,该架构结合了 Transformer 模型和卷积神经网络(CNN)的优势,旨在更有效地去除乳腺 X 光图像中的噪声,同时保留关键的诊断信息。相关研究成果发表在《Scientific Reports》上。
研究人员在开展此项研究时,主要运用了以下关键技术方法:
- 模型构建:采用基于 Transformer 的架构,设计了包含预处理模块、局部 - 全局特征提取模块和重建模块的 DeepTFormer 网络。其中,局部 - 全局特征提取模块是核心,由多个改进的 Transformer(ITransformer)层组成。
- 数据集使用:使用修订和标准化后的数字乳腺 X 线摄影筛查数据库(CBIS - DDSM),将其按 70:30 的比例划分为训练集和测试集。
- 性能评估:运用多种评估指标,如峰值信噪比(PSNR)、边缘保留指数(EPI)、结构相似性指数(SSIM)、特征相似性指数(FSIM)等,对模型性能进行定量评估。
研究结果如下:
- 模型结构与原理
- 预处理阶段:通过一个 3×3 卷积层提取局部特征,对输入图像IH×W×C进行卷积操作,得到F1=Conv(IH×W)3×3 ,F1为深层局部特征。
- 特征提取阶段:包含五个 DeepTformer 块,每个块有四个 ITransformer。在 ITransformer 的自注意力模块中,图像经过三次不同卷积,结果进行矩阵乘法、softmax 函数处理等操作,以提取全局特征。之后,通过多层感知器(MLP)进一步处理,最终将自注意力模块和 MLP 的特征相加,得到转换后的图像特征。
- 重建阶段:将全局 - 局部特征组合XiN与原始图像I连接,重建去噪后的图像I^=F2+F1 。
- 性能评估
- 对比实验:将 DeepTFormer 模型与多种先进的去噪方法,如FROST、LEE、SARBM3D等进行对比。结果表明,在不同噪声水平下,DeepTFormer 模型在 PSNR、EPI、SSIM 和 FSIM 等关键指标上均表现出色。例如,在 PSNR 指标上,DeepTFormer 模型的值达到 0.41,优于其他对比方法。
- 噪声水平影响:研究分析了不同噪声水平对模型性能的影响。通过箱线图展示,在噪声水平为 10% 时,PSNR 范围为 0.39 - 0.43;噪声水平为 100% 时,PSNR 范围为 0.33 - 0.37。EPI 在最低噪声(10%)时为 0.99,最高噪声(100%)时约为 0.94。FSIM 在最低噪声(10%)时为 0.98,最高噪声(100%)时约为 0.93。
- 综合评估:引入定量指标品质因数(FoM)对去噪算法进行综合评估。DeepTFormer 模型在所有噪声水平下均获得最高的 FoM 值,即使在 100% 噪声情况下,FoM 值仍达到 15.1313,展现出对强噪声环境的良好适应性。
研究结论和讨论部分指出,DeepTFormer 模型基于密集残差连接网络,能够有效提取局部和全局特征,在彩色和灰度图像去噪方面均优于现有方法。该模型在实际降噪研究中,在模型大小和实验性能之间展现出合理的平衡。然而,该框架在无参考图像的去噪方面存在不足,未来可引入自学习机制加以改进;同时,为提高估计速度,还可进行优化。这一研究成果为乳腺 X 光图像去噪提供了更有效的解决方案,有望提升乳腺癌早期诊断的准确性,在医学图像处理领域具有重要的应用价值。