图像预处理提升生成对抗网络性能:视网膜图像转换的关键突破

【字体: 时间:2025年05月07日 来源:Computer Methods and Programs in Biomedicine Update CS5.9

编辑推荐:

  在视网膜图像处理中,生成对抗网络(GANs)用于图像转换面临挑战。研究人员开展不同图像预处理技术对 GANs 性能影响的研究。结果表明,CycleGAN 结合 RGB-CLAHE 预处理效果最佳。这为优化 GANs 在视网膜图像分析中的应用提供依据。

  眼睛在人类感知中至关重要,而糖尿病视网膜病变(DR)作为糖尿病的并发症,严重威胁着人们的视力健康。DR 早期症状不明显,难以察觉,利用各种成像工具早期识别 DR 症状对治疗和保护视力意义重大。在众多成像技术中,彩色眼底摄影虽具有无创、成本低的优势,但提供的细节有限;荧光素血管造影(FA)能提供更详细的视网膜血管视图,有助于诊断多种疾病,然而其具有侵入性,可能会给患者带来副作用,且设备昂贵、操作复杂。
在此背景下,如何有效利用彩色眼底图像生成类似 FA 的高质量图像,成为医学影像领域亟待解决的问题。生成对抗网络(GANs)作为人工智能领域的重要技术,在图像转换等任务中展现出巨大潜力,若能将其应用于视网膜图像转换,有望解决现有成像技术的难题。然而,目前将眼底图像作为输入进行图像转换的研究较少,且现有研究在图像对齐、处理低质量图像等方面存在不足。同时,对于图像预处理技术在 GANs 图像转换中的作用,也缺乏全面深入的研究。为了填补这些研究空白,来自印度 Kasturba Medical College 的研究人员开展了一项极具意义的研究。

研究人员旨在探究不同图像预处理技术对 GANs 在双模式视网膜图像转换中性能的影响。他们选用了五种不同的图像预处理技术,分别是绿色通道提取(Green Channel)、绿色通道对比有限自适应直方图均衡化(Green Channel-CLAHE)、RGB 通道对比有限自适应直方图均衡化(RGB CLAHE)、绿色通道高斯卷积(Green Channel Gaussian Convolution)和 RGB 通道高斯卷积(RGB Gaussian Convolution)。同时,选取了五种 GAN 变体,包括 CycleGAN、Pix2Pix GAN、CUT GAN、FastCut GAN 和 NICE GAN。

研究使用的视网膜图像对来自印度 Kasturba Medical College 的 250 名患者,其中 200 对用于训练,50 对用于测试。在实验过程中,研究人员运用 GANs 的基本原理,让生成器和判别器相互对抗学习,将视网膜眼底图像转换为 FA 图像。为了评估生成图像的质量,他们采用了 Frechet Inception 距离(FID)和 Kernel Inception 距离(KID)作为评价指标,这两个指标能够有效衡量生成图像与真实图像在特征分布上的相似程度,分数越低表示生成图像越接近真实图像。

实验结果


  1. 不同 GAN 模型的最佳预处理组合:通过 30 组实验发现,不同 GAN 模型在不同预处理技术下表现各异。对于 CycleGAN 模型,RGB-CLAHE 预处理后的图像转换效果最佳,FID 和 KID 得分分别低至 103.49 和 0.038;Pix2Pix GAN 在绿色通道高斯卷积预处理时性能最优;CUT GAN 则在绿色通道高斯卷积预处理下表现最佳;FastCut GAN 在不进行预处理时效果最好;NICE GAN 在绿色通道 - CLAHE 预处理时生成的图像质量较高。
  2. 综合性能排名:综合比较,基于 FID 和 KID 得分,表现最佳的组合依次为 IV-A(RGB+CLAHE 与 CycleGAN)、III-E(绿色通道 - CLAHE 与 NICE)、V-B(绿色通道高斯卷积与 Pix2Pix)、V-C(绿色通道高斯卷积与 CUT)和 I-D(不预处理与 FastCut)。
  3. 结果的普适性验证:研究人员进一步使用公开数据集对部分最佳组合进行验证,结果显示不同来源图像的实验结果具有一致性,表明这些预处理 GAN 组合的性能具有鲁棒性和普适性。
  4. 与扩散模型的对比:研究人员还对扩散模型(Diffusion Model Translator,DMT)进行了实验,发现扩散模型对预处理步骤敏感,在处理无配对数据的领域特定转换时存在困难,而 CycleGAN 在这方面表现更优。
  5. 临床评估:研究人员邀请临床医生对生成图像进行视觉质量评估,结果表明基于指标评估的图像质量与临床医生的评价高度相关,且最佳模型 CycleGAN 在临床环境中的推理时间约为每张图像 2 秒,计算效率较高,适合集成到临床工作流程中。

研究结论和讨论


该研究全面分析了多种图像预处理技术对不同 GAN 变体在视网膜图像转换任务中的影响。研究结果表明,合适的图像预处理技术能够显著提升 GANs 的性能,其中 CycleGAN 结合 RGB-CLAHE 预处理在图像转换质量上表现最为出色。这一研究成果为医学影像领域中利用 GANs 进行视网膜图像分析提供了重要的理论依据和实践指导,有助于推动基于 GANs 的视网膜疾病诊断技术的发展。同时,研究也指出了未来的研究方向,如探索更多先进的预处理技术、在更多样化的数据集上进行验证、将 GANs 与其他机器学习方法相结合以及深入研究 GAN 架构中的注意力机制等,这些研究方向有望进一步提升图像转换的质量和可靠性,为视网膜疾病的早期诊断和治疗提供更有力的支持。该研究成果发表在《Computer Methods and Programs in Biomedicine Update》上,为相关领域的研究提供了重要参考。

研究人员在此次研究中,主要运用了以下关键技术方法:首先,收集了来自印度 Kasturba Medical College 的 250 例患者的视网膜图像对作为样本队列。然后,采用了五种不同的图像预处理技术对图像进行前期处理。接着,利用五种 GAN 变体,包括 CycleGAN、Pix2Pix GAN、CUT GAN、FastCut GAN 和 NICE GAN,进行图像转换操作。最后,通过 Frechet Inception 距离(FID)和 Kernel Inception 距离(KID)这两个指标对生成图像的质量进行评估 。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号