基于眼底影像组学与机器学习模型预测学龄儿童近视风险的研究
《Scientific Reports》:Predicting myopia risk using a machine learning model based on fundus imageomics
【字体:
大
中
小
】
时间:2025年12月13日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对儿童近视早期预警难题,创新性地结合彩色眼底照相(CFP)定量影像组学特征与机器学习算法,构建了以眼轴长度/角膜曲率半径比值(AL/CR≥3)为风险标准的预测模型。随机森林(RF)模型表现出最优预测性能(AUC=0.798),筛选出年龄、鼻侧视盘-中心凹距离、萎缩弧区及血管参数等关键预测因子。该研究为基层开展无创、低成本的近视风险筛查提供了可解释的人工智能工具。
随着全球近视患病率的持续攀升,学龄儿童近视防控已成为公共卫生领域的重要挑战。眼轴长度(AL)的过度增长是近视发生发展的核心生物学指标,但单纯依赖AL测量存在个体发育差异的干扰。近年来,眼轴长度与角膜曲率半径的比值(AL/CR)被证实能更早、更稳定地提示近视风险,因其兼顾了角膜形态的稳定性与眼轴增长的动态性。然而,AL/CR的测量依赖光学生物计等专业设备,在基层大规模筛查中难以普及。彩色眼底照相(CFP)作为一项常规、无创、低成本的眼底检查手段,若能挖掘其与AL/CR的内在关联,将极大推动社区近视筛查的可行性。既往研究多聚焦于成人高度近视的眼底改变,或利用深度学习“黑箱”模型直接预测AL,缺乏对儿童群体细微、早期眼底特征的定量解析与模型可解释性探索。
为此,张夏玲、王子勋、于景涛等研究者发表在《Scientific Reports》上的研究,旨在通过深度学习量化CFP影像组学特征,结合机器学习算法,构建一个能够预测学龄儿童近视风险(以AL/CR≥3为界值)的模型,并明确关键视网膜生物标志物。研究团队从天津地区招募6-10岁儿童,最终纳入2184张符合质量标准的CFP图像。所有图像均通过EVisionAI智能视网膜图像分析平台进行处理,该平台基于仿生视觉框架,集成计算机视觉与深度学习技术,可自动分割视盘、视网膜血管、萎缩弧等关键结构,并提取144个定量影像组学指标,再结合年龄、性别,共146个变量纳入分析。
研究采用LASSO回归进行特征筛选,并结合三位资深眼科医生的临床评估,最终确定22个关键变量用于模型构建。研究人员比较了随机森林(RF)、XGBoost、LightGBM、支持向量机(SVM)、人工神经网络(ANN)、决策树和逻辑回归(LR)共七种机器学习算法的性能。模型评估显示,RF模型表现最佳,其受试者工作特征曲线下面积(AUC)达0.798,具有高特异性(0.80)和中等敏感性(0.59),且校准曲线和决策曲线分析(DCA)均证实其良好的临床适用性。SHAP可解释性分析揭示了年龄、鼻侧视盘-中心凹距离、是否存在萎缩弧区域是前三大贡献因子,其次为血管分支角度、动脉直径等血管相关参数。
研究采用横断面设计,纳入2184名6-10岁儿童的单中心CFP图像。使用EVisionAI平台进行图像预处理(去噪、标准化、对比度增强)和深度学习分割(视盘、血管、萎缩弧等),提取144个定量特征。以AL/CR≥3作为近视风险标准,将样本按8:2分为训练集和验证集。采用LASSO回归筛选特征,并运用七种机器学习算法构建预测模型,通过五折交叉验证和网格搜索优化超参数,最终通过AUC、灵敏度、特异性等指标以及校准曲线和DCA评估模型性能,并利用SHAP和LIME进行模型可解释性分析。
七种机器学习模型中,RF模型的预测性能最优(AUC = 0.798, 95% CI: 0.760-0.835),其特异性达0.80,敏感性为0.59。LightGBM(AUC=0.753)和XGBoost(AUC=0.750)次之。校准曲线显示,除决策树和ANN外,其余五种模型预测概率与观测结果一致性较好。决策曲线分析进一步证实RF模型在较宽阈值概率范围内具有最高的临床净获益。
SHAP分析量化了各特征对RF模型预测的贡献度。年龄是最重要的预测因子,年龄增长与近视风险升高正相关。鼻侧视盘-中心凹距离增大、存在萎缩弧区域显著增加风险预测值。血管相关参数中,较大的平均血管分支角度、较小的动脉直径(尤其在鼻侧视盘周围区域)与较高的近视风险相关。视盘面积、血管长度、血管密度等形态计量学指标也显示出适度影响。
本研究首次系统地将CFP影像组学定量指标与机器学习相结合,用于预测学龄儿童基于AL/CR的近视风险。RF模型的优异表现凸显了集成学习算法在处理高维、非线性特征交互方面的优势。研究发现,眼底重要结构之间的距离变量(如鼻侧视盘-中心凹距离)、萎缩弧的存在以及血管形态参数(如分支角度、直径)是关键的预测因子,这与近视病理生理过程中后极部巩膜扩张、脉络膜变薄及视网膜血管系统重塑的理论相符。选用AL/CR而非单纯AL作为结局指标,有效减少了因儿童年龄增长带来的生理性AL变化的干扰,更精准地识别“过快”的眼轴增长信号。
研究的局限性包括横断面设计无法推断因果关系、单中心样本可能限制模型泛化能力、部分数据排除可能引入选择偏倚、45°CFP视野可能遗漏周边视网膜改变等。未来需要多中心、前瞻性队列进行外部验证,并纳入更广泛的年龄层和更长随访时间。
综上所述,该研究证实了基于定量CFP影像组学的机器学习模型能有效预测学龄儿童近视风险。RF模型整合了年龄、视网膜结构距离和血管特征等重要变量,提供了一个具有高特异性、良好校准性和临床实用性的筛查工具。鉴于CFP的普及性和非侵入性,该模型有望成为基层医疗单位进行大规模儿童近视早期风险分层的有力手段,为近视的一级预防提供重要技术支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号