
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于SHAP可解释机器学习的青少年特发性脊柱侧凸进展风险预测:一项多中心回顾性研究
【字体: 大 中 小 】 时间:2025年07月05日 来源:BMC Musculoskeletal Disorders 2.2
编辑推荐:
本研究针对青少年特发性脊柱侧凸(AIS)进展预测难题,通过卷积神经网络(CNN)提取全脊柱冠状位X线特征,结合Boruta算法筛选关键变量,构建了6种机器学习模型。XGBoost模型在外部验证中表现最优(AUC=0.896),SHAP分析揭示主弯Cobb角变化量[Cobb1(2-1)]是最重要预测因子。该研究为临床早期识别高风险患者提供了自动化、可解释的决策工具。
脊柱侧弯是困扰青少年的常见脊柱三维畸形,其中不明原因引发的青少年特发性脊柱侧凸(AIS)尤为棘手。当脊柱弯曲超过10°时,医生们就需要像侦探一样密切关注其发展动向——因为约17%的患者会悄无声息地加重,最终可能面临支具矫正甚至手术的风险。但传统预测方法存在两大痛点:人工测量Cobb角存在7-10°的误差,就像用模糊的望远镜观测星辰;而既往机器学习模型又如同"黑箱",医生难以理解其判断依据。
为解决这些难题,来自浙江大学医学院附属儿童医院等三家医疗中心的研究团队开展了一项创新性研究。他们收集了233例AIS患者的三次随访数据,让卷积神经网络(VFLDNet模型)像经验丰富的放射科医生一样自动识别椎体标志点,提取包括主/次弯Cobb角、凸侧椎体偏移距离等30项特征。通过Boruta算法这位"智能筛子",最终筛选出5个关键预测因子。研究团队构建了包括XGBoost在内的6种机器学习模型,结果发表在《BMC Musculoskeletal Disorders》的这项研究显示,XGBoost模型在外部验证中表现惊艳——准确率达88%,灵敏度高达100%,意味着所有可能加重的患者都被成功预警。
关键技术方法包括:1)采用VFLDNet模型自动提取全脊柱X线特征;2)基于浙江三家医院183例内部数据和50例外部队列;3)Boruta算法筛选关键变量;4)构建6种机器学习模型并采用SMOTE-Tomek处理数据不平衡;5)SHAP解释器分析模型决策机制。
研究结果揭示多项重要发现:
临床特征分析
数据显示胸椎侧凸(T9)比腰椎(T11)更易进展,但Boruta算法意外发现椎体位置并非关键因素,暗示脊柱侧凸进展具有复杂机制。
模型性能比较
在外部验证中,XGBoost以0.896的AUC值脱颖而出,其表现远超逻辑回归(AUC 0.701)等传统模型。特别值得注意的是,该模型实现了100%的灵敏度,意味着没有高风险患者被漏诊。
SHAP可解释性分析
如同给模型装上"透明大脑",SHAP分析清晰显示:主弯Cobb角变化量[Cobb1(2-1)]是预测进展的"头号信号",其数值每增加1°,风险就显著攀升。而次弯变化量[Cobb2(2-1)]和主弯绝对角度(Cobb1-2)分别位列二、三位。
个体化预测演示
通过SHAP力场图,医生可以直观看到:某患者61%的进展风险中,Cobb1(2-1)贡献了30%的风险增量,就像天气预报中显示各项气象要素的影响权重。
这项研究突破了传统预测方法的双重局限——既解决了人工测量误差问题,又通过SHAP解释器打开了机器学习"黑箱"。临床价值在于:仅需两次随访的X片,就能准确预判侧凸命运,使医生能像预测台风路径一样精准把握干预时机。不过研究也存在样本量有限(233例)、缺乏矢状面数据等局限。未来需要扩大样本量并整合基因组学等多维数据,让这个"智能预警系统"更加精准可靠。
正如研究者Xinyi Fang和Ting Weng等强调的,这项工作的真正突破在于:首次将SHAP可解释性与AIS预测相结合,使AI不仅会"诊断",还能"解释"诊断依据。这种透明化AI或将成为智慧医疗时代医工融合的新范式。
生物通微信公众号
知名企业招聘