基于两阶段多尺度注意力网络的弱监督白内障眼底图像增强方法研究

【字体: 时间:2025年07月30日 来源:Scientific Reports 3.8

编辑推荐:

  为解决白内障眼底图像因模糊和细节丢失导致的诊断困难问题,研究人员开发了TSMSA-Net网络。该研究通过CycleGAN域转换生成真实感合成图像,结合多尺度注意力机制在弱监督下恢复图像细节。实验表明该方法在Kaggle和ODIR-5K数据集上超越现有技术,提升了下游血管分割和疾病分类任务的性能。

  

白内障作为全球致盲的主要病因,其诊断面临的关键挑战在于眼底图像质量低下——模糊的成像会掩盖视网膜血管和病变特征,不仅影响人工判读,更导致计算机辅助诊断算法性能骤降。传统增强方法如CLAHE(对比度受限自适应直方图均衡化)和Wiener滤波存在噪声放大、细节丢失等问题,而基于深度学习的监督方法又受限于配对数据稀缺。更棘手的是,人工合成的退化图像难以覆盖真实白内障的复杂退化模式,而无监督方法则易丢失关键结构信息。

针对这一系列难题,湖南工学院安全与管理工程学院联合大连理工大学软件工程学院的研究团队在《Scientific Reports》发表创新成果,提出两阶段多尺度注意力网络(TSMSA-Net)。该研究首次通过CycleGAN域转换生成逼真合成图像解决数据稀缺问题,继而设计分层注意力机制在弱监督条件下恢复血管等微细结构。实验证实该方法在未使用真实配对数据的情况下,NIQE(自然图像质量评估)指标较现有最优方法降低0.15,IS(初始分数)提升0.08,更显著提升了血管分割准确率39%。

关键技术方法包含:1)基于高斯滤波和Retinex理论的退化模型生成初始合成图像;2)采用70×70 PatchGAN判别器的CycleGAN进行域适应转换;3)多尺度注意力模块(MSAB)集成7-9-1、5-7-1、3-5-1三种卷积核提取分层特征;4)结合SSIM(结构相似性)和TV(全变分)等5种损失函数约束增强效果。测试数据来自Kaggle白内障子集和ODIR-5K临床数据集。

真实感白内障图像合成阶段

通过改进的退化模型C(·)(公式1)模拟光学散射效应,其中α、β加权控制清晰图像与白内障噪声的混合比例,高斯滤波器gB、gL分别处理基底图像和混浊面板。随后利用CycleGAN将合成图像域S与真实白内障域R进行双向映射,配合高频提取模块H(·)(公式2)保留血管结构,最终生成与临床图像分布一致的训练数据。

多尺度注意力增强阶段

如图3所示,MSAB模块将特征Fa沿通道拆分为三支,分别通过不同尺度的注意力块(AB)提取特征。全局双分支融合块(GDFB)通过深度可分离卷积捕获空间上下文,与原始特征相乘实现跨尺度信息融合。实验显示该设计使血管对比度提升2.3倍,如图4绿色框标注区域所示。

模型优势验证

如表4所示,TSMSA-Net参数量仅0.17M,推理速度达9.43秒/图,较GFENet减少99%参数。在RFMiD数据集测试中(表7),对介质混浊(MH)的疾病分类召回率从0.79提升至0.94,证明增强图像能有效保留病理特征。图7直观展示增强后血管连续性显著改善,分支视网膜静脉阻塞(BRVO)的检出率提高56%。

该研究的突破性在于:首次实现无需严格配对数据的白内障眼底增强,通过域适应策略弥合合成与真实图像的分布差异;多尺度注意力机制创新性地结合高频引导,在弱监督条件下实现血管直径<5μm的细节恢复。成果为糖尿病视网膜病变等继发性病变的早期筛查提供了可靠预处理方案,相关技术已应用于大连眼科医院的AI辅助诊断系统。未来可进一步优化视盘区域增强,并探索与其他眼部影像模态的联合增强方法。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号