基于机器学习的体力活动差异视角:中老年人主观寿命风险因素识别与健康干预新策略

《BMC Public Health》:Identifying subjective life expectancy risk factors in physically active and inactive middle-aged and older adults using machine learning models

【字体: 时间:2025年10月18日 来源:BMC Public Health 3.6

编辑推荐:

  本研究针对人口老龄化背景下中老年人主观寿命预期(SLE)的评估难题,创新性地采用机器学习算法对比分析体力活动活跃与不活跃人群的风险因素。通过CHARLS数据库10,945名受访者数据,构建RF、LR、SVM、XGBoost和LightGBM五种模型,发现SVM模型在不活跃组(AUC=0.797)与LightGBM模型在活跃组(AUC=0.775)预测效能最优。特征重要性分析揭示年龄、自评健康、躯体疼痛等关键影响因素存在群体差异性,为制定精准化健康干预策略提供循证依据。

  
随着全球人口老龄化进程加速,联合国预测到205年65岁以上人口占比将达16-22%,中国老龄化形势更为严峻,预计老年人口将达4.83亿,占总人口34.1%。在这一背景下,中老年人如何科学规划晚年生活成为重要课题。主观寿命预期(Subjective Life Expectancy, SLE)作为个体对自身剩余寿命的主观判断,不仅反映身心健康状况,更是预测实际死亡率的重要指标,直接影响老年人的工作安排、休闲决策等生命历程规划。
既往研究表明,健康行为如吸烟饮酒会降低SLE,而体力活动(Physical Activity)作为重要健康行为,可使达到推荐活动水平的成年人死亡风险降低20-30%。值得注意的是,体力活动水平与SLE存在双向预测关系,且体力活动是SLE的因果变量。与此同时,体力不足被世界卫生组织列为全球第四大死亡风险因素,若保持当前趋势,预计到2030年将新增近5亿非传染性疾病病例。因此,区分体力活动水平研究SLE风险因素具有重要公共卫生意义。
传统研究多采用线性回归方法,难以处理变量间的复杂非线性关系。而机器学习(Machine Learning)算法能自主从多维数据中学习,在抑郁风险、欺凌行为预测等领域展现出优越性能。为此,杨健等研究人员在《BMC Public Health》发表最新研究,首次基于中国健康与养老追踪调查(CHARLS)2018年数据,采用多种机器学习算法分别构建体力活跃与不活跃中老年人的SLE风险预测模型。
研究团队采用国际体力活动问卷(IPAQ)标准,将每周体力活动低于600 METs者定义为不活跃组(1,353人),反之为活跃组(9,592人)。通过随机森林(RF)、逻辑回归(LR)、支持向量机(SVM)、XGBoost和LightGBM五种算法构建预测模型,并采用合成少数类过采样技术(SMOTE)解决类别不平衡问题。数据集按7:3划分为训练集与测试集,结合十折交叉验证与网格搜索优化超参数,以AUC、准确率、灵敏度、特异度和F1-score等指标评估模型性能。
模型性能比较结果显示:不活跃组中SVM模型表现最佳(测试集AUC=0.797,准确率=0.722,灵敏度=0.747),其ROC曲线下面积显著优于其他模型;活跃组中LightGBM模型预测效能最优(测试集AUC=0.775,准确率=0.745,特异度=0.814)。两组模型的训练集与测试集性能差异均控制在合理范围,表明模型具有良好泛化能力。
特征重要性分析发现:基于SHAP(Shapley Additive Explanations)值的可解释性分析显示,不活跃组前五位关键特征依次为:年龄(SHAP值=0.150)、自评健康(0.143)、躯体疼痛(0.130)、抑郁(0.068)和生活满意度(0.041);而活跃组特征重要性排序为:自评健康(0.566)、年龄(0.240)、教育水平(0.182)、养老金保险(0.135)和躯体疼痛(0.128)。值得注意的是,年龄在不活跃组SVM模型中贡献度最高,而自评健康在活跃组LightGBM模型中占据主导地位。
群体差异分析表明:不活跃组SLE风险率(38.8%)显著高于活跃组(26.8%),验证了体力活动对SLE的保护作用。两组人群的特征重要性结构存在明显差异:不活跃组风险因素集中于身心健康维度(抑郁、疼痛等),而活跃组则涵盖社会经济因素(教育、养老金等)。这种差异提示,针对不活跃人群的健康干预应重点关注心理健康问题,而活跃人群可能需要更全面的社会支持措施。
研究结论强调,机器学习模型能有效识别不同体力活动水平中老年人的SLE风险因素,SVM与LightGBM算法分别适用于不活跃组与活跃组的风险预测。特征重要性排序为制定差异化健康策略提供了科学依据:对于体力不活跃人群,应重点关注年龄增长带来的风险,加强疼痛管理和抑郁干预;而对活跃人群,需重视健康自评的预警作用,完善社会保障体系。
该研究的创新点在于首次采用机器学习方法量化不同体力活动水平下SLE风险因素的群体差异性,突破了传统统计方法的局限性。提出的分层干预策略为应对人口老龄化提供了新思路,特别是为体力不活跃这一高危群体的精准健康管理提供了理论支持。未来研究可结合纵向数据追踪SLE动态变化,并引入主观健康寿命期望(Subjective Healthy Life Expectancy)等综合指标,进一步深化健康老龄化研究。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号