机器学习赋能骨质疏松风险预测:整合生物标志物与临床数据的创新之道

【字体: 时间:2025年05月07日 来源:Computers in Biology and Medicine 7.0

编辑推荐:

  骨质疏松(OP)影响全球约 18% 人口,相关骨折每年累及众多人群。当前诊断金标准双能 X 线吸收法(DXA)存在局限。研究人员开发机器学习模型预测 OP 风险,该模型准确率达 93%,AUC 为 0.94。这为 OP 早期检测和风险评估提供新途径。

  
骨质疏松,这个隐匿的健康 “杀手”,正悄然威胁着全球大量人口的骨骼健康。据估算,全球约 18.3% 的 15 - 105 岁人群受其困扰,每年有多达 3700 万 55 岁以上的人因骨质疏松相关骨折而痛苦不堪。女性更易患上骨质疏松,而男性在骨折后往往面临更糟糕的后果。随着全球老龄化加剧,到 2050 年,男性髋部骨折发生率预计将比 1990 年激增三倍,女性也将翻倍。骨折带来的不仅是身体上的痛苦,还伴随着残疾和死亡风险的增加,给社会经济带来沉重负担。

目前,世界卫生组织推荐的双能 X 线吸收法(DXA)是评估骨密度(BMD)、诊断骨质疏松的金标准,也是评估骨折风险的主要方法。然而,DXA 并非完美无缺。其设备有限,即使在发达国家,也并非随处可得;而且,它存在辐射风险,这让人们对其使用有所顾虑。此外,现有的骨折风险评估工具 FRAX,虽有一定价值,但在检测某些亚临床状况患者的骨折风险时,也显得力不从心。因此,寻找一种可靠、经济且能广泛应用于临床的骨质疏松筛查方法,成为医学领域亟待解决的重要问题。

在此背景下,来自国外的研究人员开展了一项极具意义的研究。他们利用美国国家健康和营养检查调查(NHANES)2007 - 2014 年的数据,旨在开发一种机器学习模型,通过常规收集的患者数据,如生物标志物、人体测量指标和临床病史,来预测骨质疏松风险。为确保模型的广泛适用性,研究人员特意未使用任何 DXA 衍生测量数据。

研究人员在研究过程中运用了多种关键技术方法。首先,从 NHANES 数据库获取数据,这些数据涵盖了丰富的人群健康信息。然后,他们精心定义了骨质疏松的目标变量,综合考虑了 WHO 的骨密度 T 评分标准(T 评分≤ - 2.5)和人体测量风险因素,如特定百分位的年龄、体重、臂肌围等,对研究人群进行分类。在数据处理阶段,针对数据缺失、分类变量转换等问题,分别采用 K 近邻(KNN)算法和 LabelEncoder 进行处理。为解决类别不平衡问题,使用了合成少数过采样技术(SMOTE)。最后,构建了包含梯度提升(Gradient Boosting)、随机森林(Random Forest)、XGBoost 和 LightGBM 四个基础分类器以及逻辑回归元分类器的堆叠集成模型,并通过 5 折分层交叉验证等方法评估模型性能。

研究结果令人瞩目。研究初期,利用 2013 - 2014 年的 NHANES 数据进行试验,模型表现一般。随后,研究人员扩大数据集,纳入 2007 - 2008 年和 2009 - 2010 年的数据,并优化分类标准。新模型表现出色,受试者工作特征曲线下面积(ROC - AUC)达到 0.94,总体准确率为 0.93。在不同类别预测方面,正常类别的精确率为 0.93,召回率为 0.98;骨质疏松类别的精确率为 0.89,召回率为 0.73。交叉验证结果也显示模型稳健,5 折交叉验证的 ROC - AUC 分数在 0.902 - 0.946 之间,平均分为 0.929(±0.030)。

通过特征重要性分析,研究人员发现年龄(6.04%)是最具影响力的预测因素,随后是臂肌围(5.61%)、体重(5.30%)等人体测量指标,性别(3.28%)、身体质量指数(BMI,2.71%)等也具有显著影响。同时,钙摄入量(2.42%)、叶酸(2.28%)、碱性磷酸酶(2.16%)等生化标志物同样重要。此外,手 grip strength(2.21%)、体力活动指标(2.14%)、进餐时间(2.14%)等因素也对骨质疏松风险预测有一定作用。

在讨论部分,研究人员指出,虽然模型中某些人体测量变量的重要性可能因分类标准而被放大,但这些变量确实是骨质疏松的已知风险因素。该模型综合考虑了多种因素,不仅涵盖传统风险因素,还纳入了新的生物标志物,这体现了整体健康风险评估的重要性。与其他研究相比,该模型不依赖 DXA 测量数据,且采用标准化定义,具有更好的通用性和可重复性。不过,目前模型还需在不同临床环境和人群中进一步验证。未来应致力于开发并实施集成临床决策支持系统,使其能融入医院电子健康记录系统,以提高骨质疏松的早期检测和预防水平。

这项研究成果发表在《Computers in Biology and Medicine》上,为骨质疏松风险预测开辟了新的道路。其创新的模型构建方法和多因素综合分析,为后续研究提供了重要参考,有望在未来的临床实践中发挥重要作用,帮助更多人提前预防骨质疏松,降低骨折风险,改善骨骼健康状况。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号