编辑推荐:
为解决青光眼早期精准检测难题,东北大学(Tohoku University)研究人员开展 AI 青光眼筛查(AI-GS)网络研究,该网络检测精度高、计算需求低,有望广泛应用于青光眼筛查。
青光眼,作为全球不可逆失明的主要 “元凶” 之一,正随着人口老龄化的加剧,悄然威胁着越来越多人的视力健康。据统计,青光眼的患病率已超过糖尿病视网膜病变(DR)和年龄相关性黄斑变性,成为亟待解决的公共卫生挑战。在眼科临床实践中,青光眼的早期诊断一直是个 “老大难” 问题。传统的诊断方法,像视野(VF)测试,在青光眼早期阶段,由于视功能尚未出现明显异常,往往难以准确检测出病变。而且,青光眼的诊断通常需要综合眼底图像、光学相干断层扫描(OCT)、眼压(IOP)测量和 VF 测试等多种信息,不仅流程繁琐,还高度依赖专业眼科医生的经验,在医疗资源有限的地区,这种诊断方式更是 “力不从心”。
面对这些困境,东北大学(Tohoku University)的研究人员挺身而出,开展了一项旨在革新青光眼筛查技术的研究。他们聚焦于利用人工智能(AI)和深度学习(DL)技术,开发出一种基于 AI 的青光眼筛查(AI-GS)网络,力求为青光眼的早期诊断开辟新路径。经过不懈努力,研究成果显著。AI-GS 网络在检测青光眼方面展现出了卓越的性能,其敏感性和特异性均达到较高水平,为青光眼的早期发现和干预提供了有力支持,有望改变青光眼防治的现状。该研究成果发表于npj Digital Medicine期刊。
在研究过程中,研究人员运用了多种关键技术方法。首先,他们整合多个公开可用的数据集,如 EyePACS-AIROGS、REFUGE、ODIR 等,以及来自东北大学医院的患者眼底图像数据,构建了丰富多样的训练、验证和测试数据集。然后,基于深度学习框架,使用 Python 和 Keras API 结合 Tensorflow 2 开发了一系列 DL 模型,包括基于 LWBNA-unet 的多任务学习模型、二元分类模型和用于数值参数分类的模型等。此外,利用 Dice 系数、预测准确率、敏感性、特异性、受试者工作特征曲线(ROC)和曲线下面积(AUC)等多种评估指标,对模型性能进行全面评估。
下面来详细看看研究结果:
- AI-GS 网络架构:AI-GS 网络由多个 DL 模型组成,包括多任务学习、分割和分类模型。该网络以黄斑中心的眼底图像为输入,经过对比受限自适应直方图均衡化(CLAHE)方法处理后,输出包含图像报告和 CSV 文件,详细呈现视杯、视盘边界、黄斑位置、DH 位置及相关数值参数等信息。整个网络包含六个轻量级 DL 模型,总内存约 112MB,具有高效、轻便的特点。
- 基于 LWBNA-unet 的模型性能:基于 LWBNA-unet 的二元分类模型在识别含有 RNFLD 和 DH 的眼底图像方面表现出色,模型参数约 1718770 个,大小约 20.5MB,通过注意力机制实现了参数减少与预测精度的平衡。多任务学习模型(MTL_LWBNA-unet)则能同时进行视杯、视盘和黄斑中心凹的分割以及青光眼的分类任务,展现出良好的计算效率和准确性。在分割杯、盘和黄斑中心凹时,LWBNA-unet 模型性能优异,其平均 Dice 系数在验证数据集上分别为视盘 0.9582 ± 0.0204、视杯 0.8896 ± 0.0573,接近该数据集的最佳结果,且对不同来源的眼底图像具有良好的适应性。
- 青光眼预测与评估:MTL_LWBNA-unet 模型在训练和验证过程中,使用了大量来自不同来源的青光眼和正常眼底图像。五折交叉验证结果显示,模型预测准确率达到 96.2812% ± 0.4451%,AUC 为 0.9904 ± 0.0014,特异性为 0.9692 ± 0.0074,敏感性为 0.9516 ± 0.0151,表明模型性能稳定,泛化能力强。通过与基于杯盘参数的 FFCN 模型比较,MTL_LWBNA-unet 模型在青光眼预测方面表现更优,其在最佳阈值下的敏感性和特异性分别约为 96.19% 和 97.63%,而基于杯盘参数的预测敏感性仅为 85.99%,特异性为 93.39%。在不同类型青光眼的检测中,MTL_LWBNA-unet 模型对正常眼压青光眼(NTG)和原发性开角型青光眼(POAG)的预测表现相似,但对早期青光眼(PPG)的检测性能相对较低,反映出早期青光眼阶段视盘变化不明显,检测难度较大。
- 视盘出血(DH)检测:检测 DH 对青光眼诊断至关重要,但自动检测难度较大。研究人员创建了专门的 DH 检测数据集,训练基于 LWBNA 的二元分类模型。该模型在验证数据集上 AUC 为 0.8394,准确率为 78.56%;在测试数据集上 AUC 为 0.8723,准确率为 75.49%。为提高分类准确性,研究人员通过分割模型提供 DH 可能位置的空间信息,重新训练分类模型,使准确率显著提高,在测试数据集上 AUC 达到 0.9678,准确率为 90.53%,敏感性为 87.22%,特异性为 93.85%。
- 视网膜神经纤维层缺损(RNFLD)检测:RNFLD 是青光眼的早期重要体征,但检测困难且缺乏公开数据集。研究人员创建了包含 3721 张眼底图像的数据集,并对基于 LWBNA 的模型进行五折交叉验证训练。结果显示,模型平均预测准确率为 91.71 ± 3.21%,AUC 为 0.9731 ± 0.159,Youden 指数为 0.7990 ± 0.0898,最佳模型的 AUC 达到 0.9933,预测准确率为 95.97%,表明模型对 RNFLD 的检测结果令人满意。
- 多模型 AI-GS 网络筛查效果:AI-GS 网络综合多个模型的结果进行最终的青光眼筛查决策。在五折交叉验证中,其准确率比 MTL_LWBNA-unet 模型略有提高(97.47 ± 0.04% vs. 96.28 ± 0.45%)。在真实世界筛查场景中,AI-GS 网络的 AUC 从 87.8% 提升至 92.5%,敏感性从 56.5% 提升至 80.5%,特异性保持在约 91%,表现出良好的稳定性和可靠性。通过调整 AI-GS 网络的预测标准,可进一步提高对 PPG 的检测敏感性,如将某些结构变化概率超过特定阈值的病例重新分类为青光眼疑似病例(GS),能使 PPG 检测敏感性从 83.1% 提升至 87.6%,在真实世界筛查数据集中敏感性从 80.5% 提升至 93.0%,但会导致特异性下降。
综合研究结果和讨论,AI-GS 网络在青光眼筛查方面具有重要意义。它能够从黄斑中心的眼底图像中有效检测青光眼,评估视盘特征并识别早期结构变化,虽然不能完全替代 VF 测试进行青光眼的确诊,但对 PPG 的检测能力为青光眼的早期干预争取了宝贵时间。而且,该网络基于 LWBNA-unet 模型设计,计算开销低,仅为常用 Unet 模型的近三分之一,有助于将青光眼筛查整合到远程医疗中,提高眼保健的可及性。同时,AI-GS 网络不仅提供筛查结果,还能输出视杯、视盘和黄斑中心凹的详细指标,有助于眼科医生深入了解疾病进展。不过,研究也存在一定局限性,如部分数据集存在偏倚,缺乏综合诊断信息等。但随着未来更多样化数据集的收集和研究的深入,AI-GS 网络有望不断优化,成为全球青光眼防治的有力武器,为保护人们的视力健康发挥更大作用。