基于可解释机器学习的维持性血液透析患者蛋白质能量消耗风险预测模型构建与验证

《BMC Nephrology》:Explainable machine learning models for predicting of protein-energy wasting in patients on maintenance haemodialysis

【字体: 时间:2025年10月18日 来源:BMC Nephrology 2.4

编辑推荐:

  为解决维持性血液透析(MHD)患者蛋白质能量消耗(PEW)早期识别困难的问题,研究人员开展了一项基于可解释机器学习(ML)的预测模型研究。该研究通过LASSO回归筛选出透析前肌酐、握力、非高密度脂蛋白胆固醇(non-HDL-C)、高敏C反应蛋白(hs-CRP)和尿素清除指数(Kt/V)等5个关键特征,构建了XGBoost预测模型。该模型在测试集中表现出色,AUC达0.827,并成功部署为Web应用,为临床早期识别PEW高风险患者提供了实用工具。

  
对于全球数百万接受维持性血液透析(MHD)治疗的患者而言,蛋白质能量消耗(PEW)是一个普遍且棘手的并发症。它不仅是导致患者生活质量下降的元凶,更是心血管疾病高发和死亡率攀升的独立危险因素。然而,传统的PEW诊断标准往往需要长达3至6个月的动态监测,这无疑错失了早期干预的黄金窗口。虽然主观全面营养评估(SGA)等工具被广泛使用,但其主观性也影响了评估的准确性。面对这一临床困境,浙江大学医学院附属第一医院的研究团队另辟蹊径,将目光投向了人工智能领域。他们利用机器学习(ML)算法,开发并验证了一个能够精准预测MHD患者PEW风险的可解释模型,旨在为临床医生提供一把“利器”,实现高风险患者的早期识别和个性化营养管理。该研究成果已于2025年发表在《BMC Nephrology》杂志上。
为了构建这一预测模型,研究团队在2024年1月至6月期间,从浙江大学医学院附属第一医院招募了908名MHD患者作为研究对象。他们首先通过LASSO回归(一种特征选择方法)从30个候选特征中筛选出最具预测价值的变量,最终确定了5个关键特征:透析前肌酐、握力、非高密度脂蛋白胆固醇(non-HDL-C)、高敏C反应蛋白(hs-CRP)和尿素清除指数(Kt/V)。随后,研究人员利用这5个特征,分别构建了7种不同的机器学习模型,包括逻辑回归(LR)、支持向量机(SVM)、决策树(DT)、随机森林(RF)、极端梯度提升(XGBoost)、轻量级梯度提升机(LightGBM)和K近邻(KNN)。为了确保模型的可靠性和泛化能力,数据被随机分为训练集(70%)和测试集(30%),训练集用于模型开发,测试集则用于评估模型的最终性能。在模型评估环节,研究团队采用了多种指标,包括受试者工作特征曲线下面积(AUC)、灵敏度、特异度、准确率、F1分数和Brier分数,以全面衡量模型的预测能力。为了增强模型在临床实践中的可接受度,研究团队还引入了沙普利加和解释(SHAP)方法,对表现最佳的模型进行“黑箱”解读,量化每个特征对预测结果的贡献度。最终,他们将最优模型部署为一个在线Web应用程序,方便临床医生随时输入患者数据,快速获取PEW风险预测结果。
模型性能比较:XGBoost脱颖而出
在7种机器学习模型的“同台竞技”中,XGBoost模型在测试集中表现最为抢眼,其AUC值达到了0.827(95% CI, 0.772-0.883),显著优于其他模型。此外,该模型还展现出了良好的灵敏度(0.727)、特异度(0.762)、准确率(0.755)和F1分数(0.544),同时Brier分数较低(0.125),表明其预测结果与实际结果之间的差异较小。校准曲线和决策曲线分析(DCA)也进一步证实了XGBoost模型在测试集中具有最佳的预测性能和临床实用性。
模型解释:透析前肌酐和握力是“风向标”
为了揭开XGBoost模型的“神秘面纱”,研究团队利用SHAP方法对模型进行了深入解读。SHAP特征重要性排序结果显示,对模型预测贡献最大的前5个特征依次为:透析前肌酐、握力、非高密度脂蛋白胆固醇(non-HDL-C)、尿素清除指数(Kt/V)和高敏C反应蛋白(hs-CRP)。其中,透析前肌酐和握力是预测PEW风险最重要的两个“风向标”。SHAP依赖图进一步揭示了这些特征与PEW风险之间的复杂非线性关系:总体而言,PEW风险随着hs-CRP水平和Kt/V值的升高而增加,而随着透析前肌酐水平、握力以及非高密度脂蛋白胆固醇(non-HDL-C)水平的升高而降低。
临床转化:从模型到指尖工具
为了让研究成果真正服务于临床,研究团队将表现最佳的XGBoost模型成功部署为一个在线Web应用程序。临床医生只需在网页上输入患者的透析前肌酐、握力、非高密度脂蛋白胆固醇(non-HDL-C)、高敏C反应蛋白(hs-CRP)和尿素清除指数(Kt/V)这5个指标的具体数值,系统便会自动计算出该患者发生PEW的风险概率。例如,当输入一名患者的hs-CRP为20 mg/L、透析前肌酐为568 μmol/L、non-HDL-C为1.34 mmol/L、握力为15 kg、Kt/V为1.6时,模型预测其PEW风险高达70%,提示临床医生需要立即对该患者采取个性化的营养干预措施。
研究结论与讨论
本研究成功开发并验证了一个基于可解释机器学习的预测模型,用于识别维持性血液透析(MHD)患者的蛋白质能量消耗(PEW)风险。XGBoost模型凭借其卓越的预测性能(AUC=0.827)脱颖而出,成为最优模型。通过SHAP方法对模型进行解读,研究揭示了透析前肌酐、握力、非高密度脂蛋白胆固醇(non-HDL-C)、尿素清除指数(Kt/V)和高敏C反应蛋白(hs-CRP)是预测PEW风险的关键因素。其中,透析前肌酐和握力是预测PEW风险最重要的两个指标。透析前肌酐作为肌肉代谢和蛋白质摄入的产物,其水平较低可能反映了骨骼肌质量的减少或饮食蛋白质摄入不足。握力则是评估营养状况和肌肉功能的简单、无创且有效的指标,握力越低,PEW风险越高。非高密度脂蛋白胆固醇(non-HDL-C)水平过低与PEW风险增加相关,这可能与患者的营养不良或炎症状态有关。尿素清除指数(Kt/V)是评估透析充分性的常用指标,但过高的Kt/V值反而会增加PEW风险,这可能与营养不良导致尿素分布容积减小有关。高敏C反应蛋白(hs-CRP)作为炎症标志物,其水平升高会通过多种途径导致蛋白质合成减少、分解代谢增加,并引起厌食,从而增加PEW风险。该研究的重要意义在于,它不仅提供了一个高精度的预测工具,还通过SHAP方法赋予了模型“可解释性”,使临床医生能够理解模型做出决策的依据。最终,该模型被成功转化为一个易于使用的Web应用程序,为临床医生早期识别PEW高风险患者、制定个性化营养管理策略提供了有力的决策支持,有望最终改善患者的临床结局。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号