基于FastViT与EfficientNet-B0知识蒸馏的糖尿病视网膜病变分级系统:高效轻量化诊断新策略

【字体: 时间:2025年06月30日 来源:SLAS Technology 2.5

编辑推荐:

  针对糖尿病视网膜病变(DR)自动化诊断中模型复杂度和精度的平衡难题,研究人员创新性地提出FastEffNet框架,通过FastViT-MA26教师模型向EfficientNet-B0学生模型的知识蒸馏(KD),在APTOS数据集上实现95.39%准确率、0.99 AUC值和仅0.38G FLOPs的卓越性能。该研究通过Grad-CAM++可视化增强模型可解释性,为资源受限环境下的精准DR筛查提供了突破性解决方案。

  

糖尿病视网膜病变(DR)作为糖尿病最常见的微血管并发症,已成为全球工作年龄人群致盲的首要原因。世界卫生组织数据显示,全球约有9300万DR患者,其中约1/3会进展至威胁视力的阶段。传统人工分级存在主观性强、效率低下等问题,而现有深度学习模型往往面临计算复杂度高、轻量化不足的困境。如何在保持诊断精度的同时降低计算成本,成为AI辅助DR筛查走向临床落地的关键瓶颈。

针对这一挑战,研究人员开发了名为FastEffNet的创新框架,其核心在于将Transformer架构的高效特征提取能力与知识蒸馏技术相结合。研究选用APTOS 2019盲症检测数据集,包含5个严重程度等级的3662张眼底图像,通过对比度受限自适应直方图均衡化(CLAHE)等预处理手段解决图像质量不均问题,并采用过采样技术缓解类别不平衡。

关键技术方法包括:1)构建FastViT-MA26教师模型与EfficientNet-B0学生模型的蒸馏体系;2)采用温度参数T=4.0的Kullback-Leibler散度(KLD)优化知识迁移;3)综合评估准确率(Acc)、Cohen's Kappa评分(CKS)等9项指标;4)应用Grad-CAM++实现决策可视化。所有实验在配备P100 GPU的Kaggle Notebook环境中完成,确保结果可复现性。

研究结果部分,教师模型训练显示FastViT-MA26在增强数据后验证准确率达96.7%,较基线提升7%。学生模型比较中,EfficientNet-B0表现最为突出:在测试集上达到95.39%准确率(Pr=95.43%,Re=95.39%),F1-score达95.37%,且计算成本仅0.38G FLOPs。特别值得注意的是,该模型在严重类别(Class 4)的识别性能提升最为显著,F1-score从59.31%跃升至95.2%,证明数据增强策略有效解决了少数类样本不足的问题。

通过消融实验发现,温度参数T=4.0与蒸馏权重α=0.7的组合最优,过高的温度(T=5.0)会导致性能下降。在计算效率方面,EfficientNet-B0单图推理仅需11.69ms,模型大小16.22MB,显著优于MobileNetV3(39.84ms)等对比模型。Grad-CAM++可视化证实模型能准确定位微动脉瘤、出血等病理特征,与眼科医生的诊断依据高度吻合。

与现有研究横向对比,FastEffNet在多项指标上创下新高:较AAI Shafi等报道的MobileViTv2(CKS 0.94)提升6.39%准确率,比S Lakhera等提出的PSO-SVM混合模型(93%准确率)更具计算优势。特别是在评估模型一致性的加权Kappa评分(WKS)上达到0.97,证明其临床适用性。

该研究创新性地证明了FastViT作为教师模型在知识蒸馏中的独特优势:其混合注意力机制能更有效地捕捉视网膜病变的空间特征,而EfficientNet-B0通过MBConv模块的深度可分离卷积,实现了教师知识的高效迁移。研究不仅为DR筛查提供了即插即用的解决方案,更开创了视觉Transformer与轻量化CNN协同优化的新范式。未来可通过整合OCT等多模态数据,进一步突破单模态图像分析的性能天花板。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号