基于机器学习梯度提升算法的中国中老年人群肾功能快速下降预测模型构建与关键因素解析

【字体: 时间:2025年06月07日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  针对中国老龄化背景下中老年人群肾功能快速下降的公共卫生问题,广州中医药大学等机构联合采用CHARLS队列数据,运用XGBoost等梯度提升算法构建预测模型(AUC=0.765),通过LASSO回归识别eGFR、年龄、Hb等核心预测因子,结合SHAP值解析特征贡献度,为早期筛查高风险人群提供智能化工具,对慢性肾脏病(CKD)防控具有重要临床价值。

  

随着全球老龄化加剧,中国60岁以上人口比例已突破13.5%,预计2050年将达30%。年龄增长伴随的肾功能衰退已成为重大公共卫生挑战,每年eGFR下降≥3 mL/min/1.73 m2
的快速肾功能减退人群,其CKD进展风险显著升高。然而现有研究多聚焦糖尿病等特定人群,缺乏针对普通中老年群体的动态预测工具。

湖南中医药大学护理学院Yang Li与广州中医药大学Kun Zou等团队在《BMC Medical Informatics and Decision Making》发表研究,首次将机器学习与肾功能定量分析结合。研究利用中国健康与养老追踪调查(CHARLS)2011-2015年5,022名45岁以上人群数据,通过SMOTE采样解决类别不平衡问题,采用GB、XGBoost等算法构建预测模型,并创新性地将△eGFR作为连续变量进行回归分析。

关键技术方法包括:1)基于CHARLS队列的纵向数据分析;2)LASSO回归筛选特征(λ=0.0047);3)梯度提升算法模型优化(5折交叉验证);4)SHAP值解析模型可解释性;5)多元线性回归量化△eGFR影响因素。

研究结果:

  1. 模型性能:GB模型在测试集表现最优(AUC=0.765,准确率0.728),显著优于RF(0.739)和AdaBoost(0.758)。DCA曲线显示该模型具有显著临床净获益。

  2. 关键预测因子:LASSO回归筛选出16个特征,SHAP分析显示基线eGFR(SHAP=+0.09)、年龄(+0.09)、SBP(+0.05)呈正向贡献,而Hb(-0.03)、血糖(-0.02)为保护因素。

  3. △eGFR定量分析:多元回归揭示体重(β=-0.21)、血尿酸(UA,β=+1.87)、肌酐(Cr,β=+4.02)与△eGFR独立相关(P<0.01),每升高1 mg/dL UA对应eGFR年降幅增加1.87 mL/min/1.73 m2

  4. 人群特征:快速下降组(33.7%)基线eGFR更高(121.61 vs 100.71 mL/min/1.73 m2
    ),但血糖(100.80 vs 102.78 mg/dL)、UA(4.05 vs 4.35 mg/dL)水平更低(P<0.001)。

结论与意义:
该研究构建了首个适用于中国普通中老年人群的肾功能下降预测模型,突破传统二元分类局限,实现从风险预测(GB模型)到定量分析(△eGFR回归)的双重突破。发现UA、MCV等非传统指标与肾功能衰退的关联,为社区筛查提供新靶点。尽管存在未测量混杂因素(如药物使用)的局限,但模型通过SHAP可视化实现个性化风险评估,例如71岁女性患者因SBP>157 mmHg导致风险评分提升0.05。研究成果为CKD早期干预提供循证依据,推动精准健康管理在老龄化社会的应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号