
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于可解释机器学习的中国老年人内在能力下降预测模型构建与验证
【字体: 大 中 小 】 时间:2025年06月13日 来源:Maturitas 3.9
编辑推荐:
本研究针对老龄化社会健康管理的核心问题,利用中国健康与养老追踪调查(CHARLS)数据,采用XGBoost等5种机器学习(ML)算法构建内在能力(IC)下降预测模型。结果显示,XGBoost模型AUC达0.715,通过SHAP方法识别教育水平、握力等关键预测因子,为社区早期筛查提供可解释工具,对实现健康老龄化具有重要实践价值。
随着全球老龄化进程加速,世界卫生组织(WHO)提出的"内在能力(Intrinsic Capacity, IC)"概念成为评估老年人健康状态的核心指标。IC涵盖个体生理和心理功能的综合储备,其下降与跌倒、衰弱等不良结局密切相关。然而当前缺乏有效的IC下降预测工具,现有研究多聚焦影响因素分析,仅英国老龄化纵向研究(ELSA)尝试过预测模型开发,但存在"黑箱"决策难题。这一空白使得社区早期干预面临挑战,亟需建立兼具高精度和可解释性的预测体系。
扬州大学研究团队基于中国健康与养老追踪调查(CHARLS)2011-2015年数据,纳入822名基线无IC下降的老年人,采用7:3比例划分训练集与测试集。通过LASSO(最小绝对收缩选择算子)和递归特征消除筛选变量,比较逻辑回归(LR)、K近邻(KNN)、支持向量机(SVM)、随机森林(RF)和XGBoost(极限梯度提升)五种算法性能,最终选用SHAP(沙普利加性解释)方法解析最优模型决策逻辑。
研究结果
样本特征
4年随访期间IC下降发生率达44.6%(n=367)。单因素分析显示,IC下降组年龄更大、教育水平更低、握力更弱(均P<0.05),提示这些因素可能与IC衰退相关。
模型性能
XGBoost在测试集表现最优,AUC为0.715(95%CI 0.651-0.780),显著优于传统LR模型。特征重要性分析显示,教育程度、吸烟、握力、自评健康(SRH)和居住地对预测贡献度最高,其中低握力与IC下降呈强非线性关联。
临床解释性
SHAP可视化揭示:农村居民、吸烟者、低教育群体具有更高IC下降风险,而握力每增加5kg可使风险降低18%。这些发现与既往关于社会决定因素和躯体功能影响衰老的研究相互印证。
讨论与结论
该研究首次在中国人群构建IC下降的ML预测模型,其创新性体现在:1)突破传统线性模型局限,捕捉握力与IC间的非线性关系;2)通过SHAP实现"黑箱"透明化,使临床人员能理解模型决策依据;3)识别可干预因素(如握力训练、戒烟),为社区精准干预提供靶点。
成果发表于《Maturitas》,为基层医疗团队提供了一种高效筛查工具。未来可结合物联网技术实现动态监测,但需注意样本代表性局限(仅纳入基线健康人群)。这项研究为推动主动健康老龄化提供了方法论创新和实践范式,对实现"健康中国2030"战略目标具有重要参考价值。
生物通微信公众号
知名企业招聘