基于机器学习算法的无症状老年人群骨质疏松症临床预测模型构建与验证

【字体: 时间:2025年09月15日 来源:Frontiers in Medicine 3.0

编辑推荐:

  本研究基于机器学习算法构建并验证了无症状老年人群骨质疏松症(OP)的临床预测模型,创新性地整合K近邻(KNN)与随机森林(RF)组合算法,模型曲线下面积(AUC)达0.904,并通过校准曲线与决策曲线分析(DCA)证实其临床实用性。研究利用SHAP技术解析特征贡献度,发现体重、腰围、身高与教育水平为关键预测因子,并开发了基于Shiny平台的在线诊断工具,为临床提供无创、高效的OP筛查方案。

  

1 引言

骨质疏松症(Osteoporosis, OP)是一种以骨量降低和骨微结构破坏为特征的代谢性骨病,其导致的脆性骨折严重影响老年人生活质量。全球约7500万人罹患此病,亚洲地区预计至2050年将占全球OP骨折病例的50%。目前双能X线吸收检测法(DXA)是诊断金标准,但其存在辐射暴露、成本高昂及设备依赖性强等局限,亟需开发无创、高效的早期筛查工具。

2 材料与方法

2.1 研究人群

研究纳入2021年6月至2022年5月北京地区584名无症状老年人(男性161人,女性423人),其中OP患者248例(42.47%)。纳入标准包括年龄>50岁、常住北京≥5年且签署知情同意书,排除严重腰椎手术史、活动障碍或恶性肿瘤患者。

2.2 数据采集

收集指标包括年龄、性别、体力活动、教育水平(初中/高中/本科)、身高、体重、腰围、吸烟及饮酒史。体格测量由专业人员按WHO标准执行,重复两次取平均值。

2.3 模型构建与评估

采用10种机器学习算法(包括弹性网络回归Elastic Net、逻辑回归LR、随机森林RF、支持向量机SVM等)两两组合形成135个模型。数据集按7:3划分训练集与测试集,通过10折交叉验证与网格搜索优化超参数。评估指标包括灵敏度(Sensitivity)、特异度(Specificity)、AUC、Brier分数等,并绘制校准曲线与决策曲线(DCA)。

2.4 SHAP解释性分析

采用SHAP(Shapley Additive exPlanations)技术量化特征对预测结果的贡献度,增强模型可解释性。

3 结果

3.1 基线特征

OP组与非OP组在年龄上无显著差异(66.58±6.74 vs 67.34±6.02岁,P=0.157),但非OP组身高、体重、腰围均显著更高(P<0.001)。单因素分析显示性别、吸烟、饮酒、教育水平、身高、体重、腰围7个变量具有统计学意义(P<0.05)。

3.2 模型性能

KNN+RF组合模型表现最优,其灵敏度0.7500、特异度0.6634、AUC 0.904、Brier分数0.1601。其他组合如NN+SVM虽准确率最高(0.7102),但综合性能不及KNN+RF。模型比较显示组合算法显著优于单一算法(补充图S2)。

3.3 校准与临床效用

校准曲线显示KNN+RF预测值与实际值高度吻合(图4A),DCA曲线表明该模型在广泛阈值概率范围内具有临床净收益(图4B)。

3.4 特征重要性解析

SHAP分析确认体重、腰围、身高和教育水平为前四大关键预测因子(图5C)。高体重与腰围为保护因素,而低教育水平与身高增加OP风险(图5D)。个体案例显示高教育水平、高体重者OP风险显著降低(图5E)。

4 讨论

本研究创新性地将教育水平等社会因素纳入OP预测模型,弥补了传统模型仅关注生理指标的不足。体重与腰围的保护作用可能与脂肪组织内分泌功能(如脂联素调节骨密度)及肌肉因子Irisin促进成骨分化有关。低教育水平可能反映健康意识薄弱及钙摄入不足等风险行为。

开发的Shiny应用(https://osteoporosispredictionmodel.shinyapps.io/medic_predict/)可实现在线风险预测(图6),以概率>0.5为干预阈值,为临床提供便捷工具。

5 局限与展望

研究样本仅来自北京社区,需多中心外部验证;未纳入维生素D等生化指标;未来需与FRAX等国际工具对比并探索整合策略。

6 结论

KNN+RF机器学习模型可高效预测老年人OP风险,SHAP技术增强模型可解释性,Shiny应用助力临床无创筛查,为资源有限地区提供实用解决方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号