
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DeB5-XNet:基于特征提取与Grad-CAM的可解释集成模型在眼部疾病多分类中的应用研究
【字体: 大 中 小 】 时间:2025年05月27日 来源:Informatics in Medicine Unlocked CS9.5
编辑推荐:
针对眼科疾病诊断中模型可解释性不足与多分类性能受限的问题,研究人员提出集成模型DeB5-XNet,通过CLAHE-LAB图像增强和双预训练模型特征融合,实现白内障(C)、糖尿病视网膜病变(DR)、青光眼(G)和正常(N)的95%分类准确率,结合Grad-CAM可视化技术验证了模型决策与临床诊断的一致性,为AI辅助诊断提供可靠工具。
论文解读
眼睛是人类感知世界的窗口,但白内障、糖尿病视网膜病变(DR)和青光眼(G)等疾病可能导致不可逆的视力损伤。全球范围内,眼科医生资源短缺与患者数量激增的矛盾日益突出,尤其在发展中国家,早期诊断面临巨大挑战。传统AI模型多聚焦单一疾病的二元分类,且缺乏决策过程的可解释性,严重限制了临床适用性。如何构建一个能同时识别多种眼病、并解释其预测依据的智能系统,成为亟待解决的关键问题。
为此,研究人员开展了这项创新研究,提出名为DeB5-XNet的可解释集成模型。该研究通过三个关键突破实现了多疾病分类性能与可信度的双重提升:首先,采用LAB色彩空间的对比度受限自适应直方图均衡化(CLAHE-LAB)预处理技术,显著增强眼底照片(FP)中细微病变特征的可见度;其次,创新性地融合DenseNet121和EfficientNetB5两种预训练模型的异构特征,构建高性能集成分类器;最后,引入梯度加权类激活映射(Grad-CAM)技术,直观展示模型关注区域与临床诊断标志物的空间一致性。相关成果发表于《Informatics in Medicine Unlocked》,为临床决策支持系统提供了新范式。
关键技术方法
研究整合3868张眼底图像(含C/DR/G/N四类),经眼科医生筛选后采用分层划分策略构建数据集。技术路线分四阶段:1)通过CLAHE-LAB与CLAHE-RGB对比实验确定最优预处理方案;2)利用7种预训练模型(VGG16/19、ResNet18/50、DenseNet121/161、EfficientNetB5)进行特征提取;3)构建6种双模型特征融合的集成架构,采用统一分类器(含自适应池化、批归一化和Dropout层);4)基于Grad-CAM生成热力图验证模型可解释性。实验在Kaggle P100 GPU平台完成,采用交叉熵损失函数和Adam优化器训练40个epoch。
研究结果
CLAHE-LAB的预处理优势
对比实验显示,LAB色彩空间的CLAHE处理使ResNet50准确率提升3%,其他模型平均提升1%。如图5所示,LAB空间分离亮度与色度的特性有效抑制了RGB通道的噪声放大,突出视盘、血管等关键结构。这为后续特征提取奠定了质量基础。
集成模型的性能突破
DeB5-XNet(DenseNet121+EfficientNetB5)以95%的测试准确率成为最优架构,较单模型提升2-5%。特别值得注意的是,其在DR识别中达成100%的F1-score,G分类的假阴性减少35%(图4)。这种优势源于DenseNet的密集连接促进特征复用,与EfficientNet的复合缩放机制形成互补。
临床可解释性验证
Grad-CAM可视化表明(表4),模型关注区域与疾病病理特征高度吻合:C病例聚焦晶状体混浊区,DR病例锁定视网膜微动脉瘤,G病例突出视杯形态改变。这种空间一致性经眼科医生确认,显著增强了临床可信度。
讨论与意义
该研究通过技术创新解决了多病种分类与模型"黑箱"两大核心难题。DeB5-XNet的95%准确率超越近年主流模型(DSRA-CNN 87.9%、BFENet 76.7%),且是唯一兼具高性能与可解释性的方案。其临床价值体现在三方面:1)LAB空间预处理为医学图像增强提供新思路;2)特征融合策略证明异构架构的协同效应;3)Grad-CAM解释机制符合医疗AI的监管合规要求。
未来工作可扩展至更多眼病亚型分类,并探索轻量化部署方案。这项研究标志着眼科AI从单一疾病检测向综合诊断系统演进的重要一步,为实现联合国"视觉2020"目标提供了切实可行的技术路径。
生物通微信公众号
知名企业招聘