维持性血液透析患者心血管事件和全因死亡的风险预测

《Frontiers in Medicine》:Risk prediction for cardiovascular events and all-cause mortality in maintenance hemodialysis patients

【字体: 时间:2025年10月27日 来源:Frontiers in Medicine 3.0

编辑推荐:

  本研究旨在开发并比较机器学习(ML)模型与Cox回归模型在预测维持性血液透析(MHD)患者心血管事件和全因死亡率中的性能。通过回顾性分析275名患者的多维度数据,使用XGBoost、随机森林等六种ML算法,结果显示ML模型在AUC、准确率、召回率等指标上均优于传统Cox模型,尤其在长期预测中表现更优。关键预测因素包括心血管病史、铁结合容量、BMI等。

  本研究旨在利用机器学习(ML)算法开发用于维持性血液透析(MHD)患者心血管事件(CVE)和全因死亡率的预测模型,并进一步将这些模型与传统的Cox回归模型进行比较,以评估其在风险分层中的表现。心血管疾病是维持性血液透析患者中最常见的致病和致死因素,尤其是在这一高风险人群中,其对不良预后的影响尤为显著。由于慢性肾病(CKD)患者在肾功能逐渐恶化的过程中,心血管疾病的发生率和严重程度也在不断上升,因此对这类人群进行精准的风险预测显得尤为重要。

传统的心血管风险评估工具,如弗莱明风险评分、系统性冠心病风险评估和动脉粥样硬化心血管疾病风险估算,虽然在普通人群中具有一定的参考价值,但在维持性血液透析患者中的预测效果却不尽如人意。这些模型主要依赖于传统的风险因素,例如高血压、高脂血症、糖尿病和高龄,而忽视了慢性肾病本身以及透析过程所带来的独特影响。因此,它们可能低估了维持性血液透析患者的真实心血管风险。Cox比例风险模型作为生存分析和风险预测的标准工具,虽然在临床研究中广泛应用,但也存在一定的局限性。它假设变量与风险之间存在线性关系,并且变量之间相互独立,这在实际数据中并不总是成立。此外,Cox模型在处理高维数据时表现欠佳,无法有效筛选和整合大量复杂信息。

近年来,人工智能(AI)技术的快速发展为医学领域带来了新的可能性。机器学习作为AI的重要分支,通过构建和训练复杂的算法,能够从数据中学习并实现自动化决策。随着机器学习在临床预测模型中的广泛应用,其在提升诊断和预后准确性方面展现出巨大的潜力。许多临床场景中,机器学习模型的表现优于传统的统计方法,显示出其在处理复杂数据关系上的优势。

本研究纳入了2020年1月1日至2022年1月1日期间,在西南医科大学附属医院接受维持性血液透析治疗的患者。排除了有甲状旁腺切除术、腹膜透析、肾移植或恶性肿瘤病史的患者。最终,275名患者被纳入研究,并在研究期间进行了跟踪随访。这些患者的数据涵盖了人口学特征、合并症、用药史以及基线实验室值等多个方面。研究采用多种机器学习算法,包括逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)、决策树(DT)、极端梯度提升(XGBoost)和朴素贝叶斯模型(NBM),用于预测CVE和全因死亡率。为了比较这些模型的预测效果,研究通过计算AUC值来评估其区分能力。

研究结果显示,在中位随访期为50个月期间,共有119名患者经历了心血管事件,75名患者死亡。在预测CVE方面,XGBoost模型表现最为出色,其在1、2、3和4年时的AUC值分别为0.650、0.702、0.742和0.755。此外,该模型的准确率、F1分数、召回率和精确率分别为0.731、0.694、0.706和0.683。关键预测变量包括心血管疾病史、总铁结合力、体质指数、红细胞计数、平均红细胞血红蛋白含量和血清镁水平。而在预测全因死亡率方面,随机森林模型表现出最佳性能,其AUC值在1、2、3和4年时分别为0.903、0.931、0.882和0.862,准确率、F1分数、召回率和精确率分别为0.796、0.517、0.400和0.732。研究还指出,机器学习模型在所有终点上均优于传统的Cox回归模型。

本研究的发现表明,机器学习模型在维持性血液透析患者中提供了更为可靠的预后评估。这些模型能够有效处理复杂的、非线性的数据关系,而不受传统假设的限制。此外,机器学习算法能够自动选择对预测结果影响最大的特征变量,从而提高模型的可解释性和泛化能力。研究中采用的SHAP算法进一步提升了模型的可解释性,通过量化每个特征变量对模型输出的贡献,使得模型的决策过程更加透明,增强了其在临床中的可信度。

在预测心血管事件方面,XGBoost模型不仅在AUC值上表现优于其他模型,还在准确率、召回率和精确率上具有显著优势。尽管随机森林模型在AUC值上稍高,但XGBoost在其他指标上表现更优,因此被认定为最佳的CVE预测模型。SHAP分析表明,心血管疾病史是影响XGBoost模型预测结果最重要的变量,其次是总铁结合力、体质指数、红细胞计数、平均红细胞血红蛋白含量和血清镁水平。这些变量在维持性血液透析患者中与心血管事件的发生密切相关,因此在临床监测和管理中应受到重视。

在预测全因死亡率方面,随机森林模型同样表现出色,其AUC值在1、2、3和4年时分别为0.902、0.927、0.882和0.862。研究指出,随机森林模型在预测全因死亡率方面不仅具有较高的区分能力,而且在多个时间点上的表现优于传统的Cox回归模型。SHAP分析显示,透析时间、透析后β2-微球蛋白水平、B型胶原蛋白的C端肽(β-CTX)、总胆红素、淋巴细胞计数、乳酸脱氢酶、平均红细胞血红蛋白浓度以及是否使用 Roxadustat 是影响预测结果的重要变量。这些变量在维持性血液透析患者中可能对疾病预后具有重要意义。

尽管机器学习模型在预测能力上优于传统方法,但研究也指出了一些局限性。首先,本研究的数据来源于单一中心,样本量相对较小,这可能限制了研究结果的推广性。其次,虽然预测模型表现良好,但尚未进行外部验证,因此其临床应用价值仍需进一步确认。此外,研究仅使用了基线数据,未能评估这些变量随时间变化对心血管事件和全因死亡率的影响。未来的研究应更加关注大样本、多中心的数据收集,并进行外部验证以进一步优化模型。同时,引入纵向数据以考虑变量随时间的变化趋势,有助于提高预测模型的稳健性和准确性。

总的来说,机器学习模型在维持性血液透析患者中提供了更可靠的预后评估。这些模型不仅能够处理复杂的、非线性的数据关系,还能够自动选择关键预测变量,从而提高预测的准确性。此外,SHAP算法的应用使得模型的决策过程更加透明,有助于增强其在临床中的可信度。随着人工智能技术的不断发展,机器学习模型有望从研究工具逐步转变为临床助手,为维持性血液透析患者提供更加精准、可解释和可持续的风险管理服务。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号