
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自步渐进多尺度训练的糖尿病视网膜病变多分类病理特征增强鉴别方法研究
【字体: 大 中 小 】 时间:2025年07月17日 来源:Scientific Reports 3.8
编辑推荐:
针对糖尿病视网膜病变(DR)诊断中专家依赖性强、小病灶识别难的问题,研究人员提出融合自步渐进学习与随机多尺度图像重建的深度学习框架GPMKLE-Net。通过KL散度集成正则化和分级特征提取策略,在APTOS-MESSIDOR-Kaggle数据集上实现4分类AUC 0.9907,其中无DR类召回率达97.65%,重度DR类召回率达98.55%,为临床少样本DR诊断提供新范式。
糖尿病视网膜病变(DR)作为糖尿病最常见的微血管并发症,全球患者数量正以惊人速度增长——国际糖尿病联盟数据显示,2021年全球糖尿病患者已达5.37亿,预计2045年将突破7.83亿。更严峻的是,约34.6%的糖尿病患者会发展为DR,其中微动脉瘤等早期病变特征仅125微米大小,临床诊断高度依赖经验丰富的眼科专家。尽管深度学习在医学影像分析中展现出潜力,但低质量数据、样本量不足和类别不平衡等问题严重制约模型性能,尤其对轻度与中度DR的鉴别准确率长期停滞在90%以下。
澳门城市大学数据科学学院的研究团队在《Scientific Reports》发表创新成果,提出引导式渐进多尺度KL集成网络(GPMKLE-Net)。该框架通过三大核心技术突破:随机多尺度图像重建(RMIR)模拟人类视觉认知路径,从28×28像素碎片到完整224×224像素图像渐进学习;自步训练策略(Self-paced Learning)先学习简单样本再攻克复杂特征;KL散度集成正则化约束四个子模型预测一致性。在融合APTOS和MESSIDOR-Kaggle的数据集上,模型4分类AUC达0.9907,较ResNet-50基线提升2.2%,重度DR召回率98.55%且各类别精度均超91%。
关键技术包括:1) 多阶段特征融合的DR注意力残差模块(DRAR),集成SE(Squeeze-and-Excitation)机制强化微血管特征;2) 引导式DR分类器(GDRC)采用Rdrop技术生成多样化参数;3) 直方图均衡采样(HES)联合类别平衡焦点损失(?CBFocal),缓解数据偏态分布问题;4) 四层级联训练架构,通过KL正则化损失(?Rdrop)约束预测一致性。
研究结果揭示:
整体性能:在MESSIDOR-Kaggle数据集达到94.47%准确率,显著优于Swin-Transformer(73.87%)、ConvNeXt(92.71%)等11种对比模型。APTOS验证集AUC 0.9872,证明跨数据集泛化能力。
多尺度重建优势:热力图分析显示,28×28像素训练阶段模型广泛关注微动脉瘤等局部特征,而112×112像素阶段聚焦硬性渗出物等全局病理标志。

类别不平衡对策:HES使轻度DR识别率从85.99%提升至92.93%,混淆矩阵显示类间误判率下降40%。
损失函数优化:复合损失?all=λCE?CE+λCB?CBFocal+λRdrop?Rdrop使无DR类精度达96.54%,突破传统交叉熵损失瓶颈。
该研究的创新性体现于:首次将元学习思想引入DR分类,通过模拟人类渐进认知过程,在少样本条件下实现病理特征分层提取。临床意义在于:1) 为资源匮乏地区提供高精度筛查工具;2) 多尺度特征可视化助力医生定位亚临床病灶;3) KL集成策略降低模型对单一数据源的依赖性。未来工作将探索自监督预训练与病变定位的结合,进一步提升模型在异构数据上的鲁棒性。
生物通微信公众号
知名企业招聘