
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于NASNet-Large和ResNet-50迁移学习的糖尿病视网膜病变早期检测与分级研究
【字体: 大 中 小 】 时间:2025年09月05日 来源:Informatics in Medicine Unlocked CS9.5
编辑推荐:
本研究针对糖尿病视网膜病变(DR)早期诊断难题,创新性地采用NASNet-Large和ResNet-50卷积神经网络进行迁移学习,通过组合式图像预处理(GCE/CLAHE)和类平衡策略,在APTOS 2019数据集上实现早期DR检测准确率0.96(F1 0.97)、多阶段分类准确率0.91(F1 0.91),为临床自动化筛查提供高精度解决方案。
糖尿病视网膜病变(DR)作为糖尿病最常见的微血管并发症,已成为全球致盲的首要原因之一。据统计,全球DR患者数量从2010年的9300万激增至2040年预计的6.42亿,其中约28%将发展为威胁视力的晚期阶段。尽管早期干预可有效延缓病情,但传统诊断依赖眼科专家人工判读眼底图像,存在工作量大、主观性强等局限,尤其在资源匮乏地区更显突出。
近年来,基于深度学习的计算机辅助诊断系统展现出巨大潜力,但现有研究仍面临三大挑战:早期病变特征细微导致检测困难;数据集类别不平衡影响模型评估;不同预处理方法效果存在争议。针对这些问题,Sreebhadra Vallukappully团队在《Informatics in Medicine Unlocked》发表研究,首次将NASNet-Large架构应用于DR早期检测,并系统评估了图像预处理组合的协同效应。
研究采用APTOS 2019数据集(3662张专家标注的眼底图像),通过Python 3.13/TensorFlow 2.1.8平台构建两类模型:早期检测采用NASNet-Large(输入尺寸331×331),多阶段分类使用ResNet-50(224×224)。关键技术包括:1)组合测试绿色通道提取(GCE)和对比度受限自适应直方图均衡化(CLAHE);2)过采样与实时数据增强解决类不平衡;3)宏平均法计算多分类指标。
4.1. 早期阶段分类
通过冻结NASNet-Large顶层、添加二元全局平均池化层,模型在测试集表现优异:最佳组合(GCE+CLAHE+增强)准确率达96.81%,F1分数96.85%,特异性98.06%。值得注意的是,预处理步骤对性能提升有限(<1%),暗示该架构可能直接从原始图像中有效提取特征。
4.2. 多阶段分类
ResNet-50模型经精细调整(含512/256单元的全连接层和0.5 dropout率),在五分类任务中:GCE+CLAHE组合表现最佳(准确率91.14%,F1 91.18%),较单独使用CLAHE提升5%。混淆矩阵显示,模型对"无DR"和"增殖性DR"识别最准(准确率>95%),而"中度"与"重度"存在12-17%误判,反映疾病连续进展的特征重叠难题。
这项研究通过系统实验揭示了三个重要发现:首先,NASNet-Large在DR早期检测中展现出超越EfficientNet等现有架构的性能(较文献报道最高精度提升7%);其次,类平衡策略使性能评估更可靠,避免了既往研究因数据倾斜导致的指标虚高;最后,预处理效果具有模型依赖性——对NASNet-Large影响微弱,但对ResNet-50至关重要。
临床转化方面,该成果为开发低成本的DR筛查系统提供了技术基础,尤其适合医疗资源匮乏地区。未来结合可解释AI(XAI)技术,有望进一步增加临床信任度。研究团队已通过开放科学框架公开代码,促进方法学的透明化和可重复性。正如van der Linde在讨论中指出,这种"预处理组合测试+严格类平衡"的研究范式,为医学图像分析领域树立了方法学新标准。
生物通微信公众号
知名企业招聘