IlluC-Net:一种基于注意力机制的U-Net模型,用于皮肤科宏观照片中的光照校正

《Franklin Open》:IlluC-Net: An attention-guided U-Net for illumination correction in dermatological macro-photographs

【字体: 时间:2025年11月21日 来源:Franklin Open CS1.4

编辑推荐:

  针对皮肤病学宏观照片中不均匀背景照明影响诊断的问题,提出基于U-Net与注意力机制的IlluC-Net模型。通过实验验证,该模型在PSNR(35.99±3.15 dB)、SSIM(0.98±0.01)等指标上优于U-Net、GAN等7种SOTA方法,同时保持计算效率(90ms/图,31.3M参数),适用于边缘设备部署。

  皮肤癌是全球范围内最为常见且具有潜在致命性的疾病之一,每年都有大量新病例被诊断出来。随着医学影像技术的发展,特别是皮肤病学宏观摄影的广泛应用,皮肤癌的早期检测和准确诊断变得尤为重要。然而,这种高分辨率的图像在实际应用中常常面临一个严重的问题,即不均匀的背景光照。这种现象通常被称为“暗角效应”或“ vignetting”,表现为图像边缘逐渐变暗,导致病变区域与周围皮肤的照明不一致。这种不均匀的光照不仅影响医生的视觉判断,还显著降低了自动化诊断工具的性能,从而影响皮肤癌的准确识别和分类。

为了解决这一问题,研究团队提出了一种名为 IlluC-Net 的新型深度学习框架,专门用于皮肤病学宏观图像的照明校正。该模型基于 U-Net 架构,并引入了注意力机制,以有效捕捉图像中的局部和全局特征。U-Net 架构因其对图像的对称编码-解码结构,已被广泛应用于医学图像处理领域,而注意力机制的引入则增强了模型对关键区域的关注,使得照明校正更加精准,同时避免了不必要的背景信息干扰。这种结合方式使得 IlluC-Net 能够在不破坏病变区域结构和纹理的前提下,实现背景光照的均衡,从而提升图像的对比度和诊断准确性。

在训练过程中,IlluC-Net 采用了均方误差(MSE)作为损失函数,以衡量校正后的图像与真实图像之间的像素级差异。MSE 的目标是使模型输出尽可能接近真实值,减少误差。此外,为了防止模型过拟合,研究团队还采用了动态学习率调度和早停策略。这些策略在训练过程中根据验证损失的变化自动调整学习率,并在验证损失不再改善时提前终止训练,从而在保证模型性能的同时提高训练效率。

为了验证 IlluC-Net 的性能,研究团队使用了来自 Waterloo 大学皮肤癌数据集和 MED-NODE 数据集的图像进行实验。实验采用了五折交叉验证方法,以确保模型在不同数据子集上的泛化能力。在定量评估中,IlluC-Net 在多个指标上表现优异,包括峰值信噪比(PSNR)和结构相似性指数(SSIM)。其 PSNR 值达到 35.99 ± 3.15 dB,SSIM 值为 0.98 ± 0.01,显著优于其他最先进的照明校正方法,如 U-Net、TransUNet、GAN、EnlightenGAN、CSWin-P 和 IECET。同时,IlluC-Net 在无参考图像质量评估(IQA)指标如 BRISQUE、PIQE 和 NIQE 上表现更佳,分别获得 27.09 ± 10.43、44.39 ± 9.77 和 0.27 ± 0.02 的低分值,表明其校正后的图像在视觉上更加自然,减少了不必要的光照伪影和纹理不一致问题。

从定性分析来看,IlluC-Net 生成的图像在视觉上与真实图像最为接近,保留了病变区域的色彩、边界和纹理特征,同时避免了过饱和和颜色失真等问题。相比之下,其他方法如 U-Net 和 TransUNet 虽然在亮度提升方面表现良好,但未能有效消除纹理失真或边界模糊的问题。GAN 基础的方法,如 StillGAN 和 EnlightenGAN,则在处理复杂光照变化方面存在一定的局限,导致图像中出现过多的平滑效果或色彩偏差。而基于变压器的模型,如 CSWin-P 和 TransUNet,虽然在处理全局特征方面具有优势,但其计算资源需求较高,影响了在边缘设备上的部署效率。

在计算复杂度方面,IlluC-Net 与 U-Net 相比,其参数数量和推理时间相近,均在 30M 左右,推理时间为 90 毫秒。这表明 IlluC-Net 在保持高性能的同时,具备较低的计算开销,非常适合在资源受限的设备上进行部署。与其他方法相比,如 StillGAN 和 EnlightenGAN,IlluC-Net 的推理时间更短,且参数数量更少,进一步证明了其在计算效率上的优势。此外,传统方法如 IECET 和 Suchitra 等人的方法虽然在模型规模上较小,但其推理时间较长,通常在 170 毫秒左右,这限制了其在实时诊断中的应用。

IlluC-Net 的优势在于其结合了 U-Net 的结构和注意力机制,使得模型能够在处理不均匀光照时,更精确地识别和校正影响病变区域的像素,同时保留病变的细节信息。这种设计不仅提升了图像的视觉质量,还增强了后续诊断任务(如分割和分类)的可靠性。此外,由于 IlluC-Net 的推理时间短且参数数量适中,其在边缘设备上的部署成为可能,从而为临床提供更加便捷和高效的诊断工具。

未来的研究方向可能包括进一步优化注意力机制,以更好地处理光照梯度较大的区域,避免过度校正带来的问题。此外,研究团队还计划探索多尺度注意力机制和感知损失函数的结合,以进一步提升模型在复杂光照条件下的表现。同时,IlluC-Net 可以与现有的皮肤癌诊断系统相结合,提高自动化诊断的准确性和效率。研究团队认为,随着医学影像技术的不断发展,IlluC-Net 这样的照明校正框架将在临床和自动化诊断领域发挥越来越重要的作用。

总之,IlluC-Net 作为一种轻量级的深度学习框架,通过结合 U-Net 架构和注意力机制,实现了对皮肤病学宏观图像中不均匀光照的有效校正。其在定量和定性评估中均表现出色,特别是在保持病变特征和减少光照伪影方面。此外,IlluC-Net 的计算效率和推理速度使其成为部署在边缘设备上的理想选择,为皮肤癌的早期检测和诊断提供了新的解决方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号