基于三重粒度条件引导扩散模型的糖尿病视网膜病变分类方法TCG-DiffDRC研究

《Image and Vision Computing》:Diffusion model-based imbalanced diabetic retinal image classification

【字体: 时间:2025年11月02日 来源:Image and Vision Computing 4.2

编辑推荐:

  本文提出创新性三重粒度条件引导扩散模型TCG-DiffDRC,通过全局特征分支(改进ResNet-50+CAM)、局部特征分支(门控注意力机制)和细节分支(可解释神经Transformer)的协同融合,结合分类引导噪声调整机制(CGNAM)和分割掩码正则化约束,在APTOS2019等三大公开数据集实现86.7%准确率,显著提升糖尿病视网膜病变(DR)分类的精度与可解释性。

  
Highlight
本文的创新亮点在于:1)构建了首个面向糖尿病视网膜病变分类的三重粒度条件引导扩散模型TCG-DiffDRC;2)提出分类引导噪声调整机制(CGNAM)动态优化扩散过程;3)将分割掩码作为正则化项嵌入损失函数,增强病灶区域结构一致性。
Diabetic retinopathy classification
糖尿病视网膜病变(DR)作为糖尿病最常见并发症之一,其早期筛查和精准分级对临床干预至关重要。近年来,基于深度学习的方法已成为DR自动分类的核心工具,主要研究方向包括:基于卷积神经网络(CNN)的改进架构、Transformer与自监督表征学习方法,以及基于生成模型的方法。
Methodology
TCG-DiffDRC模型整体架构如图1所示(图示略)。模型以三重粒度条件引导系统(TCGS)为核心,通过三个并行分支处理输入图像:全局特征分支(yglobal)采用改进ResNet-50架构捕获宏观特征,局部特征分支(ylocal)通过门控注意力机制聚合关键区域信息,细节分支(yquery)基于可解释神经Transformer(INTR)提取细粒度病灶特征。三路特征融合后形成统一表征yfusion
Datasets
本研究使用三个公开DR数据集:APTOS2019包含18,590张眼底图像,Messidor提供1,200张图像且按4等级分类,IDRiD包含516张图像并标注5类病变。
Comparison with state-of-the-art methods
如表1所示(表格略),TCG-DiffDRC在三大数据集上均取得最优性能。APTOS2019数据集上准确率达86.7%,F1分数75.8%;Messidor数据集Kappa系数0.812;IDRiD数据集AUC值0.942,显著超越DiffMIC等基线模型。
Analysis of results
消融实验验证了各模块贡献:三重粒度系统使准确率提升4.2%,CGNAM机制提高Kappa值3.5%,分割掩码正则化增强病灶区域特征一致性。可视化结果显示模型能精准定位微动脉瘤(MA)、出血(HE)等关键病变。
Conclusion
TCG-DiffDRC通过多粒度特征提取与扩散模型创新结合,为糖尿病视网膜病变分类提供了高精度、强可解释性的解决方案。未来工作将探索跨中心数据泛化能力和实时临床部署可行性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号