基于可解释多机器学习模型的视网膜特征预测高度近视:关键生物标志物与临床转化价值
【字体:
大
中
小
】
时间:2025年10月14日
来源:Frontiers in Bioengineering and Biotechnology 4.8
编辑推荐:
本研究通过多机器学习算法(XGBoost、CatBoost等)结合SHAP可解释性分析,系统评估了29项视网膜结构参数对高度近视(HM)的预测效能。研究发现眼底镶嵌密度、动脉平均曲率、视盘旁萎缩宽度等12个特征对HM预测贡献显著,其中XGBoost模型表现最优(AUC=0.87)。该研究为HM的早期筛查提供了量化标准与临床解释框架。
全球高度近视(HM)患病率显著上升,其与白内障、青光眼、黄斑变性等致盲性眼病风险增加密切相关。HM早期常伴随眼底结构改变,但传统影像分析方法依赖眼科医生经验,难以实现快速精准诊断。本研究基于视网膜成像组学与可解释机器学习(ML)框架,探讨视网膜特征在HM预测中的作用,为临床筛查提供量化依据。
本研究经天津市眼科医院伦理委员会批准(TJYYLL2021018),回顾性纳入2019年8月至2021年12月期间的2981例患者(左眼数据),其中HM组(SE≤?6.00 D)1191眼,非HM组(SE>?6.00 D)1790眼。所有患者均接受主客观验光检查,排除合并其他眼部疾病或全身性疾病者。
采用深度学习语义分割网络对眼底图像进行自动化分析,量化视网膜镶嵌密度、视盘参数、视杯参数、视盘旁萎缩区域及视网膜血管结构等29项特征。标注工作由两名资深眼科医生通过半自动机器学习辅助流程完成,其中第二位医生的标注作为金标准。
使用XGBoost、CatBoost、LightGBM、随机森林(RF)和神经网络(NN)五种ML算法构建预测模型,通过5折交叉验证评估性能。采用SHapley Additive exPlanations(SHAP)方法分析特征对预测结果的贡献度,计算关键特征的临床截断值。
XGBoost模型在验证集中表现最优,准确率达0.81(95% CI 0.78–0.85),受试者工作特征曲线下面积(AUROC)为0.87(95% CI 0.84–0.89),显著优于其他模型。
SHAP分析显示,前12位重要预测特征包括:镶嵌密度、7项血管参数(如动脉平均曲率、静脉直径等)、2项视盘旁萎缩参数(宽度、面积)及2项视盘参数(垂直直径等)。其中,镶嵌密度>0.025、视盘旁萎缩宽度>400 μm、面积>0.60×106 μm2与HM风险增加相关;而动脉平均曲率>0.00063、血管直径>55.2 μm、静脉曲率>0.00128、视盘垂直直径>1320 μm等特征与HM风险降低相关。
本研究首次通过可解释ML框架系统量化全视网膜结构参数对HM的预测价值。眼底镶嵌密度作为最强预测因子,其机制可能与脉络膜变薄导致的色素上皮层暴露有关。动脉弯曲度降低反映组织缺氧状态,而HM患者眼轴增长对视网膜的机械牵拉可能进一步影响血管几何形态。视盘旁萎缩的宽度与面积参数以及视盘垂直直径的显著性,为临床评估HM提供了新视角。
本研究为单中心回顾性设计,未纳入45岁以上人群及青少年患者数据。此外,眼轴长度等关键参数未完全收集,未来需结合多中心前瞻性数据验证模型的普适性。
基于可解释ML的视网膜成像组学方法能有效识别HM的关键生物标志物。镶嵌密度>0.025、视盘旁萎缩参数增大及血管几何参数减小可作为HM风险预测的量化指标。该框架提升了ML模型在眼科临床决策中的透明度和可信度,为高危人群的早期干预提供了新策略。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号