
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于视网膜影像的可解释Transformer模型在阿尔茨海默病早期检测中的突破性研究
【字体: 大 中 小 】 时间:2025年07月25日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对阿尔茨海默病(AD)早期诊断难题,开发了新型Retformer模型,通过视网膜影像(OCT/眼底照相)实现AD检测准确率达92%,较现有方法提升11%。团队创新性地结合Transformer架构与Grad-CAM可解释技术,首次系统验证视网膜神经纤维层(RNFL)厚度、脉络膜厚度等生物标志物与AD的关联,为AD筛查提供非侵入性解决方案。
阿尔茨海默病(AD)作为全球最常见的神经退行性疾病,其早期诊断一直是医学界的重大挑战。传统诊断依赖昂贵的MRI/PET扫描或侵入性检测,而近期研究发现视网膜作为中枢神经系统延伸,其血管和结构变化与AD密切相关。然而现有基于卷积神经网络(CNN)的视网膜影像分析方法存在准确率不足(普遍低于85%)、可解释性差等问题,难以满足临床需求。
德黑兰大学纳米技术-生物技术-信息技术与认知科学实验室的研究团队在《Scientific Reports》发表突破性研究,开发了名为Retformer的新型Transformer架构。该模型通过分析视网膜光学相干断层扫描(OCT)和眼底图像,实现了92%的AD检测准确率,较现有最佳模型提升11个百分点。研究首次系统验证了视网膜神经纤维层(RNFL)厚度减少、脉络膜变薄等特征与AD的强相关性,为AD早期筛查提供了高精度、可解释的解决方案。
关键技术方法包括:1) 采用旋转位置编码(RoPE)和分组查询注意力(GQA)的Transformer架构,处理50×50像素的视网膜影像;2) 使用嵌套交叉验证和贝叶斯优化进行超参数调优;3) 应用梯度加权类激活映射(Grad-CAM)可视化关键生物标志物;4) 数据集包含Bissig等提供的224例3D-OCT图像和TRENDv2眼底数据库。
【Retformer模型设计】
研究团队创新性地将CNN与Transformer结合:输入嵌入层采用CNN提取图像块特征,配合非学习的RoPE位置编码;Transformer层包含GQA注意力机制和SwiGLU激活函数。消融实验证明,该设计在保持4M参数量(仅为VGG-16的1/10)的同时,显著提升小样本数据的泛化能力。
【性能评估】
在OCT数据集上,Retformer各项指标全面领先:准确率(92% vs VGG-16的81%)、灵敏度(90% vs 80%)、特异性(91% vs 85%)和AUC(0.96 vs 0.87)。眼底数据虽样本量较小(14%AD病例),仍达到94%准确率。统计检验显示所有性能提升均具极显著意义(p<0.001)。
【可解释性发现】
通过Grad-CAM可视化发现:1) OCT图像中,RNFL和脉络膜层变化贡献最大(与临床研究报道的p<0.001相关性一致);2) 眼底图像中,左侧视网膜血管和视盘区域权重最高。这些发现与Cheung等提出的AD视网膜生物标志物理论高度吻合。
【讨论与意义】
该研究首次证明Transformer架构在视网膜影像分析中的优越性:1) 长程依赖建模能力使其较CNN更擅长捕捉视网膜全域特征;2) 可解释技术揭示了AD特异性的视网膜改变模式;3) 为临床提供可部署的筛查工具,单次检查成本仅为传统方法的1/10。局限性在于样本量较小,未来需扩大多中心验证。研究团队建议后续重点探索OCT血管成像(OCTA)在AD微血管病变检测中的应用。
这项突破性工作不仅为AD早期诊断开辟了新途径,更建立了视网膜影像与神经退行性疾病的关联框架,对帕金森病等疾病的筛查也具有重要借鉴意义。论文中采用的XAI技术范式,为医疗AI的可信部署提供了重要参考。
生物通微信公众号
知名企业招聘