DeepRetina:基于数据协调与高效深度学习架构的多视网膜疾病分类框架研究

《ARABIAN JOURNAL FOR SCIENCE AND ENGINEERING》:DeepRetina Framework for Multi-retinal Diseases Classification

【字体: 时间:2025年12月16日 来源:ARABIAN JOURNAL FOR SCIENCE AND ENGINEERING 2.9

编辑推荐:

  本研究针对视网膜疾病诊断中数据集有限、质量不一致等挑战,提出DeepRetina框架,通过系统化数据协调将五个不同视网膜图像数据集整合为包含29,966张高分辨率眼底图像的统一数据集,涵盖八种疾病类别。研究比较了Custom CNN、EfficientNetV2和MobileNetV3Large架构的性能,其中EfficientNetV2实现了79%的准确率和54%的精确度。该研究通过(1)建立异构数据集协调方法,(2)构建大规模统一数据集,(3)提供深度学习架构的比较分析,为眼科领域自动化疾病诊断奠定了重要基础。

  
在全球范围内,视网膜疾病是导致视力障碍的主要原因,影响着数百万人的生活质量。青光眼(Glaucoma)、糖尿病视网膜病变(DR)、白内障(Cataract)等疾病若不能早期诊断,往往会导致不可逆的视力丧失。尽管深度学习在医学影像分析领域取得了显著进展,但视网膜疾病分类仍面临严峻挑战:数据集不一致、成像协议差异以及缺乏统一的高质量数据集限制了模型的泛化能力。
这些挑战具体表现为不同来源的视网膜图像在强度、编码和空间特性上存在显著差异,导致现有AI模型在实际应用中准确性和可靠性不足。特别是多中心研究中,不同成像设备和条件引入的图像质量、颜色和照明变化,严重影响了自动化诊断系统的性能。
在这项发表于《Arabian Journal for Science and Engineering》的研究中,Sara Sweidan和Ahmed Taha提出了DeepRetina框架,旨在通过数据协调和先进的分类技术解决这些问题。该研究通过整合五个不同的视网膜图像数据集,构建了一个包含29,966张高分辨率眼底图像的统一数据集,涵盖八种疾病类别,为多疾病分类提供了重要基础。
研究人员采用了几项关键技术方法:首先,通过系统化的数据协调流程,包括尺寸标准化、视野(FOV)掩模应用和质量评估,确保图像质量一致性;其次,采用颜色归一化和光照校正技术减少多源图像差异;最后,比较了三种深度学习架构(Custom CNN、EfficientNetV2和MobileNetV3Large)的性能,其中EfficientNetV2结合了神经架构搜索(NAS)和自适应方差阈值(AVT)技术,优化了特征提取和疾病识别流程。数据集来源于五个公开可用的视网膜图像数据库,经过严格的质量控制和标准化处理。
4 Results and Evaluation
4.1 Dataset Description
研究整合了五个不同的视网膜图像数据集,包括Ocular Disease Recognition、Glaucoma Dataset、APTOS-2019等,通过系统的预处理和协调流程,最终形成了一个统一的包含29,966张高分辨率眼底图像的数据集。这些图像覆盖了八种疾病类别:正常(N)、青光眼(G)、糖尿病视网膜病变(DR)、白内障(C)、年龄相关性黄斑变性(MD)、高血压(H)、病理性近视(PM)以及其他疾病(O)。数据分布显示存在明显的类别不平衡,正常类有11,003张图像,而高血压类仅有206张图像,这为模型训练带来了挑战。
4.3 Data Harmonization
数据协调流程包括颜色归一化、光照校正、对比度增强和掩模应用等关键步骤。视觉比较显示,协调后的图像在保持临床相关信息完整性的同时,有效校正了颜色、照明和对比度的全局变化。关键诊断标志物如微动脉瘤、渗出物、血管结构和视盘边界在协调后仍保持完整,确保了疾病特异性图像特征的完整性。
4.4 Classification Models
研究比较了三种深度学习架构的性能:Custom CNN、EfficientNetV2和MobileNetV3Large。Custom CNN包含五个卷积层,采用2×2最大池化和ReLU激活函数;EfficientNetV2使用复合缩放策略和Fused-MBConv块,结合NAS和AVT技术;MobileNetV3Large则侧重于计算效率,适用于实时临床设置。所有模型均使用Adam优化器,学习率为0.001,训练100个周期。
4.5 Comparative Analysis
性能评估结果显示,EfficientNetV2实现了最佳性能,准确率达到79%,精确度为54%。混淆矩阵分析表明,EfficientNetV2在主要疾病类别(如DR和G)上表现出较低的误分类率,而对少数类别(如H和MD)的分类性能相对较弱。多类ROC曲线分析显示,模型在白内障检测(AUC=0.99)和病理性近视检测(AUC=0.98)上表现优异,而在高血压(AUC=0.87)和黄斑变性(AUC=0.86)上的性能相对较低。
4.6 Comparison DeepRetina with Other Methods
与现有方法相比,DeepRetina框架在多个方面展现出优势。虽然79%的准确率低于某些单一数据集研究的性能(如某些研究报道的99.8%),但该研究涉及更复杂的多疾病、多数据集分类任务,具有更高的临床实用价值。传统的单一数据集研究往往面临过拟合、图像质量差和泛化能力有限的问题,而DeepRetina通过数据协调有效解决了这些挑战。
研究结论表明,DeepRetina框架通过数据协调和先进的深度学习架构,为自动化视网膜疾病诊断提供了可扩展的解决方案。EfficientNetV2结合NAS和AVT技术的集成,显著提升了模型在多种视网膜疾病分类任务中的性能。尽管存在类别不平衡和计算需求较高等限制,但该研究建立的异构数据集协调方法和大规模统一数据集,为未来眼科医学图像分析研究奠定了重要基础。
这项工作通过标准化预处理、标签协调和图像归一化,有效解决了视网膜疾病诊断中的关键挑战,为改善眼科疾病的检测和分类做出了重要贡献。研究的核心价值在于提供了一种能够处理真实世界变异性的稳健方法,推动了自动化医学图像分析在眼科领域的实际应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号