面向共病老年人群的简化时变可解释生存预测模型M-SAGE的开发与验证

《npj Aging》:Development and validation of a simplified time-dependent interpretable machine learning-based survival model for older adults with multimorbidity

【字体: 时间:2025年12月17日 来源:npj Aging 6

编辑推荐:

  本研究针对老年共病患者死亡率预测工具复杂、实用性不足的问题,开发并验证了一个仅含年龄、BMI、烹饪和如厕能力4个简易指标的时变可解释机器学习生存模型。该模型在内部验证集C-index达0.7524,外部验证集C-index达0.7104,表现出优异判别力与校准度,并通过在线工具M-SAGE实现个性化风险分层,为基层医疗提供高效决策支持。

  
随着全球人口老龄化进程加速,多重共病(multimorbidity)——即个体同时存在两种及以上慢性疾病的现象——在老年人群中的患病率持续攀升,给公共卫生系统带来严峻挑战。据统计,中国老年人共病患病率已超过30%,且随年龄增长急剧上升。共病状态不仅显著增加全因死亡风险,还导致医疗开支攀升、长期照护需求增加等一系列问题。尽管早期干预措施如生活方式调整、药物优化和功能训练等被证实可有效降低共病老年患者的死亡率和功能衰退,但在临床实践中,缺乏精准且易用的生存预测工具来识别高风险个体、指导个性化干预和优化资源配置,成为制约防控效果提升的关键瓶颈。
目前针对共病老年患者的生存预测主要依赖传统统计方法,现有的一年死亡率预测评分在外部验证中仅表现出中等预测性能(C-index:0.62-0.69),难以满足临床需求。传统模型难以捕捉高维健康特征间复杂的非线性关系和交互作用,限制了其泛化能力。虽然机器学习算法在处理复杂数据方面具有优势,但现有研究多受限于单一模型、小样本量、缺乏外部验证,且很少探索预测因素的时变效应。在基层医疗或资源有限场景中,过多的预测变量会增加数据收集负担并阻碍模型部署。因此,开发兼具高预测精度和简易变量集的生存预测模型,对提升共病老年人群健康管理的临床可行性至关重要。
为应对这一挑战,厦门大学公共卫生学院Junmin Zhu、Huanglong Chen、Siyu Duan、Yafei Wu和Ya Fang研究团队在《npj Aging》上发表了最新研究成果。该研究利用两个具有全国代表性的中国老年队列——中国老年健康影响因素跟踪调查-幸福家庭研究(CLHLS-HF;n=8675)和中国健康与养老追踪调查(CHARLS;n=4171),开发并外部验证了一个简化的、时变的、可解释的机器学习生存预测模型。
研究采用四阶段特征筛选流程(单变量Cox回归、L1惩罚Cox回归、100次Bootstrap的多模型重要性排序和累积性能评估),从58个候选变量中筛选出4个常规易得的预测指标:年龄、体重指数(BMI)、烹饪能力和如厕能力。在五种机器学习算法中,简约Cox模型表现最佳,内部验证C-index为0.7524,外部验证C-index为0.7104,时间依赖性Brier评分(time-BS)分别为0.1417和0.1157,且具有良好的校准度、决策曲线净收益和亚组公平性。时变置换重要性分析证实,年龄是主导预测因子,如厕能力主要贡献短期预测,烹饪能力主导中长期预测,而BMI的影响则相对 modest 且稳定。研究成果已封装为名为M-SAGE的在线工具,可实现快速、可解释的死亡风险分层,并为共病老年人个性化干预提供支持。
研究团队为开展此项研究,主要应用了以下几项关键技术方法:基于两个全国代表性社区老年队列(CLHLS-HF和CHARLS)的前瞻性设计;采用四阶段特征选择框架(单变量Cox初步筛选、Cox-LASSO正则化细化、多模型Bootstrap特征重要性排序、累积性能评估)以平衡简约性与预测精度;利用五种生存机器学习算法(Coxph、Coxnet、GBM、XGBoost、Stacking)进行模型构建与比较;使用时变置换重要性分析(基于Brier Score和1-AUC损失函数)量化预测因子的动态贡献;通过决策曲线分析(DCA)、校准曲线和亚组公平性分析全面评估模型性能与临床效用。
研究结果
研究队列特征
开发队列(CLHLS-HF)纳入8675名共病老年人,平均年龄85.80±11.05岁,女性占55.07%,基线平均患病2.94种。1年、5年和10年生存率分别为87.42%、48.20%和26.29%,中位生存时间4.74年。外部验证队列(CHARLS)纳入4171名患者,平均年龄71.16±5.92岁,1年和5年生存率分别为95.76%和84.28%。两队列在年龄、婚姻状况、教育水平、心理状态、生活方式、日常生活活动能力(ADL)限制和慢性病分布等方面存在显著异质性(SMD>0.20),增强了模型验证的严谨性。
特征筛选过程
四阶段特征筛选框架最终确定了年龄、烹饪能力、BMI和如厕能力为核心预测因子。跨算法重要性排序高度一致,年龄、烹饪能力和BMI在Coxnet、GBM和XGBoost中稳居前三。累积性能曲线显示,XGBoost在加入如厕能力后出现显著边际增益,故最终保留这四项指标,实现了简约性与性能的最佳平衡。敏感性分析证实该框架优于直接Cox-LASSO筛选或全特征集排序策略。
内部与外部验证
基于四项指标构建的五种生存模型中,Coxph模型在内部测试集表现最优,C-index为0.7524,时间依赖性AUC(time-AUC)为0.7879,time-BS为0.1417,决策曲线显示其在广泛概率阈值范围内具有净收益。在外部验证中,该模型保持良好性能(C-index=0.7104,time-AUC=0.6568,time-BS=0.1157),校准曲线在1、3、5和10年时间点均显示预测风险与观察风险高度一致。时变ROC分析显示,测试集1、5、10年AUROC分别为0.776、0.834和0.917,验证集1、5年AUROC分别为0.784和0.745,表明模型具备稳健的短期和可接受的中期判别能力。基于最优阈值划分的高危组与低危组5年生存率差异显著(测试集:26.77% vs 78.60%;验证集:45.95% vs 88.07%),成功实现风险分层。
预测因子功能与非线性关联
限制性立方样条(RCS)分析揭示,年龄与死亡风险呈S形非线性关系,在86岁时风险比(HR)超过1。BMI与风险呈倒J形关联,风险在BMI<19时上升,在25左右达到最低(HR=0.8),随后再次缓慢增加。Kaplan-Meier曲线按ADL功能评分(0=无需协助,1=需部分协助,2=需完全协助)分层显示,烹饪能力(log-rank=810.48, P<0.001)和如厕能力(log-rank=548.30, P<0.001)均存在显著生存差异,无需协助者中位生存期最长(烹饪:7.68年;如厕:5.58年)。
时变可解释性分析
基于置换的变量重要性分析动态量化了各特征在整个生存期内的贡献。年龄始终是主导预测因子,置换后1年和5年AUC分别下降0.1399和0.1645。如厕能力在1年内是第二大影响因素(AUC损失:0.0192),但随后持续下降。烹饪能力的影响随时间增强,5年时超过如厕能力(AUC损失:0.0245 vs. 0.0079)。BMI的影响最小且最稳定(AUC损失<0.0055)。两种损失函数下的时变特征重要性排序一致,证明了结果的稳健性。
公平性分析
模型在性别和共病数量等敏感属性上未发现显著交互作用,亚组分析显示预测性能无实质性差异,强制纳入这些敏感属性也未明显改变模型结果,表明模型满足了群体公平性原则。
在线工具应用
基于FAIR原则开发的M-SAGE在线交互工具(https://juinzhu.shinyapps.io/Survival_multimorbidity/),用户输入个体特征即可获得个性化生存概率预测和可视化结果,提升了模型的可用性和可及性。
研究结论与意义
本研究成功开发并验证了一个面向共病老年人群的简化、时变可解释生存预测模型。该模型仅需四个常规易得的预测指标(年龄、BMI、烹饪能力和如厕能力),即在内部和外部验证中表现出优于现有工具的预测性能(C-index>0.71)。研究通过严谨的四阶段特征筛选框架和多种机器学习算法比较,确保了模型的稳健性和最佳简约性。
模型的时变可解释性分析揭示了预测因子贡献的动态变化规律,为分期干预提供了量化依据:年龄作为不可改变因素全程主导风险;如厕能力反映核心生理功能和自理能力,是短期生存的关键预警指标;烹饪能力代表需要认知和协调能力的高阶功能,主导中长期风险预测;BMI则呈现倒J形关联,强调维持适度营养状态的重要性。这些发现提示,功能依赖和营养状态可能是连接共病与死亡风险的重要中介途径,值得未来深入研究。
研究成果通过M-SAGE在线工具实现转化,为基层医疗和资源有限场景提供了低成本、易部署的死亡风险分层解决方案。模型的良好公平性确保了其在异质人群中的泛化能力和临床实用性。尽管存在随访数据缺失、未纳入衰弱等多模态数据、缺乏死因特异性信息等局限,但本研究为推动共病老年人群的精准健康管理迈出了关键一步。未来工作重点将围绕模型与电子病历系统的深度整合、临床医生对时变解释结果的理解提升以及跨部门协作实施年龄特异性干预策略等方面展开,最终助力实现健康老龄化的目标。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号