机器学习赋能骨质疏松风险预测：整合生物标志物与临床数据的创新之道

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年05月07日 来源：Computers in Biology and Medicine 7.0

编辑推荐：

　　骨质疏松（OP）影响全球约 18% 人口，相关骨折每年累及众多人群。当前诊断金标准双能 X 线吸收法（DXA）存在局限。研究人员开发机器学习模型预测 OP 风险，该模型准确率达 93%，AUC 为 0.94。这为 OP 早期检测和风险评估提供新途径。

骨质疏松，这个隐匿的健康 “杀手”，正悄然威胁着全球大量人口的骨骼健康。据估算，全球约 18.3% 的 15 - 105 岁人群受其困扰，每年有多达 3700 万 55 岁以上的人因骨质疏松相关骨折而痛苦不堪。女性更易患上骨质疏松，而男性在骨折后往往面临更糟糕的后果。随着全球老龄化加剧，到 2050 年，男性髋部骨折发生率预计将比 1990 年激增三倍，女性也将翻倍。骨折带来的不仅是身体上的痛苦，还伴随着残疾和死亡风险的增加，给社会经济带来沉重负担。

目前，世界卫生组织推荐的双能 X 线吸收法（DXA）是评估骨密度（BMD）、诊断骨质疏松的金标准，也是评估骨折风险的主要方法。然而，DXA 并非完美无缺。其设备有限，即使在发达国家，也并非随处可得；而且，它存在辐射风险，这让人们对其使用有所顾虑。此外，现有的骨折风险评估工具 FRAX，虽有一定价值，但在检测某些亚临床状况患者的骨折风险时，也显得力不从心。因此，寻找一种可靠、经济且能广泛应用于临床的骨质疏松筛查方法，成为医学领域亟待解决的重要问题。

在此背景下，来自国外的研究人员开展了一项极具意义的研究。他们利用美国国家健康和营养检查调查（NHANES）2007 - 2014 年的数据，旨在开发一种机器学习模型，通过常规收集的患者数据，如生物标志物、人体测量指标和临床病史，来预测骨质疏松风险。为确保模型的广泛适用性，研究人员特意未使用任何 DXA 衍生测量数据。

研究人员在研究过程中运用了多种关键技术方法。首先，从 NHANES 数据库获取数据，这些数据涵盖了丰富的人群健康信息。然后，他们精心定义了骨质疏松的目标变量，综合考虑了 WHO 的骨密度 T 评分标准（T 评分≤ - 2.5）和人体测量风险因素，如特定百分位的年龄、体重、臂肌围等，对研究人群进行分类。在数据处理阶段，针对数据缺失、分类变量转换等问题，分别采用 K 近邻（KNN）算法和 LabelEncoder 进行处理。为解决类别不平衡问题，使用了合成少数过采样技术（SMOTE）。最后，构建了包含梯度提升（Gradient Boosting）、随机森林（Random Forest）、XGBoost 和 LightGBM 四个基础分类器以及逻辑回归元分类器的堆叠集成模型，并通过 5 折分层交叉验证等方法评估模型性能。

研究结果令人瞩目。研究初期，利用 2013 - 2014 年的 NHANES 数据进行试验，模型表现一般。随后，研究人员扩大数据集，纳入 2007 - 2008 年和 2009 - 2010 年的数据，并优化分类标准。新模型表现出色，受试者工作特征曲线下面积（ROC - AUC）达到 0.94，总体准确率为 0.93。在不同类别预测方面，正常类别的精确率为 0.93，召回率为 0.98；骨质疏松类别的精确率为 0.89，召回率为 0.73。交叉验证结果也显示模型稳健，5 折交叉验证的 ROC - AUC 分数在 0.902 - 0.946 之间，平均分为 0.929（±0.030）。

通过特征重要性分析，研究人员发现年龄（6.04%）是最具影响力的预测因素，随后是臂肌围（5.61%）、体重（5.30%）等人体测量指标，性别（3.28%）、身体质量指数（BMI，2.71%）等也具有显著影响。同时，钙摄入量（2.42%）、叶酸（2.28%）、碱性磷酸酶（2.16%）等生化标志物同样重要。此外，手 grip strength（2.21%）、体力活动指标（2.14%）、进餐时间（2.14%）等因素也对骨质疏松风险预测有一定作用。

在讨论部分，研究人员指出，虽然模型中某些人体测量变量的重要性可能因分类标准而被放大，但这些变量确实是骨质疏松的已知风险因素。该模型综合考虑了多种因素，不仅涵盖传统风险因素，还纳入了新的生物标志物，这体现了整体健康风险评估的重要性。与其他研究相比，该模型不依赖 DXA 测量数据，且采用标准化定义，具有更好的通用性和可重复性。不过，目前模型还需在不同临床环境和人群中进一步验证。未来应致力于开发并实施集成临床决策支持系统，使其能融入医院电子健康记录系统，以提高骨质疏松的早期检测和预防水平。

这项研究成果发表在《Computers in Biology and Medicine》上，为骨质疏松风险预测开辟了新的道路。其创新的模型构建方法和多因素综合分析，为后续研究提供了重要参考，有望在未来的临床实践中发挥重要作用，帮助更多人提前预防骨质疏松，降低骨折风险，改善骨骼健康状况。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号