编辑推荐:
骨质疏松(OP)影响全球约 18% 人口,相关骨折每年累及众多人群。当前诊断金标准双能 X 线吸收法(DXA)存在局限。研究人员开发机器学习模型预测 OP 风险,该模型准确率达 93%,AUC 为 0.94。这为 OP 早期检测和风险评估提供新途径。
骨质疏松,这个隐匿的健康 “杀手”,正悄然威胁着全球大量人口的骨骼健康。据估算,全球约 18.3% 的 15 - 105 岁人群受其困扰,每年有多达 3700 万 55 岁以上的人因骨质疏松相关骨折而痛苦不堪。女性更易患上骨质疏松,而男性在骨折后往往面临更糟糕的后果。随着全球老龄化加剧,到 2050 年,男性髋部骨折发生率预计将比 1990 年激增三倍,女性也将翻倍。骨折带来的不仅是身体上的痛苦,还伴随着残疾和死亡风险的增加,给社会经济带来沉重负担。
目前,世界卫生组织推荐的双能 X 线吸收法(DXA)是评估骨密度(BMD)、诊断骨质疏松的金标准,也是评估骨折风险的主要方法。然而,DXA 并非完美无缺。其设备有限,即使在发达国家,也并非随处可得;而且,它存在辐射风险,这让人们对其使用有所顾虑。此外,现有的骨折风险评估工具 FRAX,虽有一定价值,但在检测某些亚临床状况患者的骨折风险时,也显得力不从心。因此,寻找一种可靠、经济且能广泛应用于临床的骨质疏松筛查方法,成为医学领域亟待解决的重要问题。
在此背景下,来自国外的研究人员开展了一项极具意义的研究。他们利用美国国家健康和营养检查调查(NHANES)2007 - 2014 年的数据,旨在开发一种机器学习模型,通过常规收集的患者数据,如生物标志物、人体测量指标和临床病史,来预测骨质疏松风险。为确保模型的广泛适用性,研究人员特意未使用任何 DXA 衍生测量数据。
研究人员在研究过程中运用了多种关键技术方法。首先,从 NHANES 数据库获取数据,这些数据涵盖了丰富的人群健康信息。然后,他们精心定义了骨质疏松的目标变量,综合考虑了 WHO 的骨密度 T 评分标准(T 评分≤ - 2.5)和人体测量风险因素,如特定百分位的年龄、体重、臂肌围等,对研究人群进行分类。在数据处理阶段,针对数据缺失、分类变量转换等问题,分别采用 K 近邻(KNN)算法和 LabelEncoder 进行处理。为解决类别不平衡问题,使用了合成少数过采样技术(SMOTE)。最后,构建了包含梯度提升(Gradient Boosting)、随机森林(Random Forest)、XGBoost 和 LightGBM 四个基础分类器以及逻辑回归元分类器的堆叠集成模型,并通过 5 折分层交叉验证等方法评估模型性能。
研究结果令人瞩目。研究初期,利用 2013 - 2014 年的 NHANES 数据进行试验,模型表现一般。随后,研究人员扩大数据集,纳入 2007 - 2008 年和 2009 - 2010 年的数据,并优化分类标准。新模型表现出色,受试者工作特征曲线下面积(ROC - AUC)达到 0.94,总体准确率为 0.93。在不同类别预测方面,正常类别的精确率为 0.93,召回率为 0.98;骨质疏松类别的精确率为 0.89,召回率为 0.73。交叉验证结果也显示模型稳健,5 折交叉验证的 ROC - AUC 分数在 0.902 - 0.946 之间,平均分为 0.929(±0.030)。
通过特征重要性分析,研究人员发现年龄(6.04%)是最具影响力的预测因素,随后是臂肌围(5.61%)、体重(5.30%)等人体测量指标,性别(3.28%)、身体质量指数(BMI,2.71%)等也具有显著影响。同时,钙摄入量(2.42%)、叶酸(2.28%)、碱性磷酸酶(2.16%)等生化标志物同样重要。此外,手 grip strength(2.21%)、体力活动指标(2.14%)、进餐时间(2.14%)等因素也对骨质疏松风险预测有一定作用。
在讨论部分,研究人员指出,虽然模型中某些人体测量变量的重要性可能因分类标准而被放大,但这些变量确实是骨质疏松的已知风险因素。该模型综合考虑了多种因素,不仅涵盖传统风险因素,还纳入了新的生物标志物,这体现了整体健康风险评估的重要性。与其他研究相比,该模型不依赖 DXA 测量数据,且采用标准化定义,具有更好的通用性和可重复性。不过,目前模型还需在不同临床环境和人群中进一步验证。未来应致力于开发并实施集成临床决策支持系统,使其能融入医院电子健康记录系统,以提高骨质疏松的早期检测和预防水平。
这项研究成果发表在《Computers in Biology and Medicine》上,为骨质疏松风险预测开辟了新的道路。其创新的模型构建方法和多因素综合分析,为后续研究提供了重要参考,有望在未来的临床实践中发挥重要作用,帮助更多人提前预防骨质疏松,降低骨折风险,改善骨骼健康状况。