多维度健康指标驱动的老年骨质疏松风险预测模型构建与验证:一项基于双中心的大样本横断面研究

《BMC Musculoskeletal Disorders》:Construction and validation of a multi-dimensional health indicator-driven osteoporosis risk prediction model: a large-sample cross-sectional study based on two centers

【字体: 时间:2025年10月18日 来源:BMC Musculoskeletal Disorders 2.4

编辑推荐:

  本研究针对老年骨质疏松症患病率上升及现有单因素筛查方法的局限性,开展了一项基于双中心15,307例老年人群的多维度健康指标驱动风险预测模型研究。通过整合人口学特征、生理指标、生活方式及实验室检查数据,采用多因素Logistic回归和多种机器学习算法构建模型,并验证其稳定性。结果显示,Logistic回归模型在训练集、内部验证集和外部验证集的AUC分别为0.687、0.675和0.679,具有良好的判别力、校准度和临床实用性,为老年骨质疏松早期筛查和精准预防提供了有效工具。

  
随着人口老龄化进程加速,骨质疏松症及其相关骨折的发病率逐年攀升,已成为威胁老年人健康和生活质量的重大公共卫生问题。骨质疏松作为一种以骨量减少和骨微结构破坏为特征的全身性骨病,早期症状隐匿,多数患者直至发生骨折才被确诊,错失了最佳干预时机。传统筛查主要依赖双能X线吸收测定法(DXA),但设备昂贵、操作复杂,难以在基层医疗机构普及。此外,骨质疏松的发生受年龄、性别、生活方式等多因素影响,仅依靠骨密度值评估风险存在局限性。近年来,超声骨密度(UBD)检测因操作简便、成本低而受到关注,但如何整合多维度健康指标构建高效风险预测模型仍是当前研究的难点。
为突破上述瓶颈,Cai Zhifeng等研究人员在《BMC Musculoskeletal Disorders》发表了一项基于双中心大样本的横断面研究,旨在构建并验证一个多维度健康指标驱动的老年骨质疏松风险预测模型。研究团队于2023年纳入张家港市疾病预防控制中心(中心A)11,957例和张家港市第五人民医院(中心B)3,350例老年体检人群,随机将中心A数据按7:3划分为训练集(8,369例)和内部验证集(3,588例),中心B作为外部验证集。通过电子病例报告表(eCRF)系统收集人口学信息(年龄、性别、BMI、教育水平、职业类型)、生理指标(心率、血压)、生活方式(运动频率、每日运动时间、吸烟饮酒习惯、牛奶摄入)、营养补充及实验室检查(血红蛋白Hb、白细胞计数WBC、甘油三酯TG等)数据。骨质疏松诊断采用UBD T值≤-2.5为标准,通过多因素Logistic回归和机器学习算法(包括Logistic回归、随机森林、极端梯度提升、支持向量机和朴素贝叶斯)构建模型,并利用受试者工作特征(ROC)曲线、校准曲线和决策曲线分析(DCA)评估模型性能。
主要技术方法概述
研究采用双中心横断面设计,纳入15,307例老年人群,通过标准化电子问卷收集多维度健康指标。骨质疏松诊断基于超声骨密度(UBD)T值≤-2.5,利用多因素Logistic回归筛选独立风险因素,并比较五种机器学习算法的预测效能。模型通过内部验证(7:3随机分割)和跨中心外部验证评估稳定性。
研究结果
1. 临床特征分析
中心A训练集与内部验证集基线特征分布一致,骨质疏松患病率均为25.3%。中心B患病率为20.69%,两组在年龄、职业、运动习惯等变量存在显著差异(P<0.05),为模型跨中心泛化性评估提供了基础。
2. 风险因素识别
多因素Logistic回归显示,年龄(OR=1.048)和心率(OR=1.015)是独立风险因素,而BMI(OR=0.968)、中学教育水平(OR=0.745)、职业类型(如失业者OR=0.385)、每日运动(OR=0.721)、牛奶摄入(OR=0.774)、血红蛋白(OR=0.990)和甘油三酯(OR=0.923)为保护因素。
3. 模型构建与可视化
基于上述因素构建列线图(Nomogram),年龄对总评分贡献最大,其次为BMI和血红蛋白。
4. 模型性能比较
Logistic回归模型在训练集、内部验证集和外部验证集的AUC分别为0.687(95%CI 0.674-0.700)、0.675(0.655-0.696)和0.679(0.657-0.701),显著优于随机森林(外部验证AUC=0.626)等算法,且校准曲线接近理想对角线,决策曲线显示在风险概率0.1-0.6范围内具有临床净获益。
5. 变量重要性分析
随机森林模型显示,职业类型、每日运动时间和血红蛋白在所有数据集中均具有高且稳定的重要性评分(10-30分),而年龄重要性在外部验证中下降,反映不同算法关注点的差异。
结论与意义
该研究成功构建了一个基于多维度健康指标的老年骨质疏松风险预测模型,其核心价值在于整合了易获取的临床指标(如职业类型、运动习惯、血红蛋白等),无需依赖昂贵设备即可实现个体化风险评估。模型通过双中心验证证明了良好的跨机构泛化能力,为资源有限地区的基层筛查提供了实用工具。此外,研究揭示了社会经济因素(如教育、职业)对骨健康的显著影响,提示政策制定需关注高危人群的差异化干预。未来需通过前瞻性队列研究进一步验证模型对骨折事件的预测效能,推动骨质疏松防控从被动治疗向主动预防转变。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号