编辑推荐:
为探究疼痛与跌倒关联机制,研究人员基于中国健康与养老追踪调查(CHARLS)数据,针对 13,074 名中老年疼痛与非疼痛人群,构建 4 年跌倒风险预测模型。发现疼痛显著增加跌倒风险(adj.OR 1.40),Logistic 回归(LR)模型表现最佳(AUC-ROC 0.732/0.692),为精准预防提供依据。
随着全球老龄化加剧,老年人跌倒已成为重要公共卫生问题。我国数据显示,65 岁以上人群每年约 30% 发生跌倒,且因跌倒导致的伤害和死亡人数逐年上升。跌倒受生理衰退、慢性疾病、环境等多因素影响,而疼痛作为常见老年症状,虽被证实与跌倒风险相关,但其内在机制及不同人群(疼痛 vs 非疼痛)的风险预测差异尚不明确。传统研究多采用单因素分析,难以捕捉高维数据间复杂关联,且缺乏针对疼痛人群的特异性预测模型。因此,开展基于大样本的机器学习建模,解析疼痛人群跌倒的关键驱动因素,对实现精准预防具有重要临床价值。
汕头大学医学院第一附属医院运动医学中心、汕头大学公共卫生学院等机构的研究人员,基于中国健康与养老追踪调查(CHARLS)2011-2015 年数据,纳入 13,074 名 45 岁以上中老年人群(其中疼痛组 4,358 人,非疼痛组 8,716 人),旨在通过机器学习方法构建并比较疼痛与非疼痛人群的 4 年跌倒风险预测模型,揭示不同人群的关键风险因素。研究成果发表于《Scientific Reports》。
研究主要采用以下技术方法:
- 数据来源与预处理:使用 CHARLS 公开数据库,通过排除标准筛选样本,采用 MissForest 算法填补缺失值,Z-score 标准化处理数据,并通过 LASSO 算法进行特征选择。
- 机器学习建模:运用 Logistic 回归(LR)、随机森林(RF)、XGBoost、朴素贝叶斯(NB)和人工神经网络(ANN)5 种算法,分别构建疼痛与非疼痛人群的跌倒风险预测模型,采用 5 折交叉验证和贝叶斯优化调参,以 AUC-ROC、Brier 分数等评估模型性能。
- 模型解释与分析:利用 Shapley Additive exPlanations(SHAP)值分析特征重要性,结合部分依赖图(PDP)可视化关键变量对跌倒风险的影响。
研究结果
1. 疼痛与跌倒风险的关联
- 单因素分析:疼痛组 4 年跌倒发生率(42.9%)显著高于非疼痛组(29.5%),调整混杂因素后,疼痛人群跌倒风险提高 40%(adj.OR=1.40, 95% CI:1.29-1.53)。
- 疼痛特征的影响:下肢疼痛(adj.OR=1.71)、重度疼痛(adj.OR=1.53)和多部位疼痛(adj.OR=1.43)的跌倒风险更高,提示疼痛部位和强度是重要风险分层指标。
2. 机器学习模型性能比较
- 模型表现:在疼痛人群中,LR 模型的 AUC-ROC 最高(0.732),其次为 ANN(0.729)和 RF(0.731);非疼痛人群中,LR 模型 AUC-ROC 为 0.692,略优于 RF(0.691)和 ANN(0.688)。
- 校准能力:LR 模型的 Brier 分数最低(疼痛组 0.197,非疼痛组 0.165),表明其预测概率与实际风险吻合度更高,兼具良好的区分度和校准度。
3. 关键风险因素识别
- 共同因素:跌倒史和身高是两组人群的共享重要特征。跌倒史反映既往风险的持续性,身高降低可能与骨质疏松、肌肉萎缩等导致的平衡能力下降相关。
- 疼痛人群特异性因素:包括功能受限、短物理性能电池测试(SPPB)评分、白细胞(WBC)计数、慢性疾病评分、生活满意度、血小板计数、烹饪燃料类型及疼痛部位数量。其中,炎症指标(WBC)和物理功能(SPPB)的突出作用提示,疼痛可能通过炎症介导的肌肉功能衰退增加跌倒风险。
- 非疼痛人群特异性因素:婚姻状况、年龄、抑郁症状、认知功能、听力、雨天数、居住整洁度和睡眠时间。心理因素(抑郁、认知)和环境因素(居住条件)的主导作用表明,非疼痛人群的跌倒风险更依赖社会心理及环境干预。
4. 亚组分析与模型稳定性
- 年龄分层:在 45-60 岁和≥60 岁亚组中,疼痛人群的 LR 模型 AUC-ROC 均高于非疼痛人群(0.720 vs 0.677;0.722 vs 0.676),提示疼痛对各年龄段跌倒风险的预测价值更显著。
- 跨模型一致性:SHAP 分析显示,疼痛人群中跌倒史、功能受限、SPPB、WBC、慢性疾病评分、身高和疼痛部位数量在 5 种模型中均排名前 10,表明这些特征具有强鲁棒性。
研究结论与意义
本研究首次基于中国大样本队列,系统揭示了疼痛与中老年跌倒风险的关联模式及人群异质性。结果表明,疼痛人群的跌倒风险更高,且关键因素与非疼痛人群存在显著差异:前者以生理功能衰退和炎症反应为主,后者以社会心理和环境因素为主。LR 模型在两类人群中均表现出最佳预测性能,且通过 SHAP 分析提供了可解释的风险特征,为临床早期筛查提供了实用工具。
研究意义在于:
- 精准预防:针对疼痛人群应重点关注下肢功能、炎症管理及慢性疾病控制,而非疼痛人群可通过改善居住环境、心理健康干预降低风险。
- 模型应用:LR 模型的高可解释性使其适用于临床决策,结合 CHARLS 等公开数据,可推广至社区老年人群的跌倒风险评估。
- 机制探索:首次通过机器学习整合多维度数据,发现烹饪燃料等环境因素与疼痛人群跌倒的关联,提示空气污染可能通过炎症途径间接增加风险,为后续机制研究提供方向。
尽管研究存在回顾性数据的局限性(如跌倒报告偏倚),但其大样本量、多算法比较及人群分层分析为老年跌倒的精准防控提供了重要证据,未来需进一步通过前瞻性研究和外部验证提升模型泛化能力。