
-
生物通官微
陪你抓住生命科技
跳动的脉搏
开发并验证了一种用于预测冠状动脉旁路移植术后急性肾损伤的机器学习模型:来自MIMIC数据库和真实世界心脏外科患者队列的见解
《BMC Nephrology》:Development and external validation of a machine learning model for predicting post-CABG acute kidney injury: insights from MIMIC database and real-world cardiac surgery cohort
【字体: 大 中 小 】 时间:2026年06月10日 来源:BMC Nephrology 2.4
编辑推荐:
摘要目的急性肾损伤(AKI)是冠状动脉旁路移植(CABG)术后的一种严重并发症。尽管在大型重症监护病房(ICU)数据库上训练的机器学习模型越来越普遍,但它们在现实世界中针对特定外科群体的泛化能力仍不明确。本研究旨在利用通用ICU数据开发一个CABG术后AKI预测模型,并严格评估其
急性肾损伤(AKI)是冠状动脉旁路移植(CABG)术后的一种严重并发症。尽管在大型重症监护病房(ICU)数据库上训练的机器学习模型越来越普遍,但它们在现实世界中针对特定外科群体的泛化能力仍不明确。本研究旨在利用通用ICU数据开发一个CABG术后AKI预测模型,并严格评估其在该模型能否应用于独立的心脏外科中心。
本研究采用了一项回顾性双中心研究。开发队列包括来自MIMIC数据库的6,347名CABG术后患者,独立的外部验证队列包括来自徐州医科大学附属医院(AHXY)的534名患者。特征选择采用了最小绝对收缩量和选择算子回归方法。对九种机器学习算法进行了基准测试,最终随机森林模型被选为最优模型。性能评估通过精确度-召回率曲线下面积(PR-AUC)、ROC曲线下面积(AUC)和决策曲线分析来进行。使用SHapley加性解释(SHAP)来解释各特征对预测结果的贡献。
在MIMIC内部测试集中,随机森林模型表现出中等程度的区分能力,PR-AUC为0.888(95%置信区间:0.871–0.904),AUC为0.709。然而,在外部AHXY队列中应用时,模型性能显著下降,PR-AUC降至0.309,AUC降至0.548。这种接近随机的预测性能表明,未经进一步调整,该模型缺乏直接的现实世界泛化能力。SHAP分析确定体重、血清磷酸盐水平和红细胞分布宽度是关键预测因子。性能下降归因于人群间的显著异质性(如BMI差异)以及心脏外科手术特有的病理生理环境,这些因素无法被通用ICU变量完全捕捉。
当将通用ICU模型应用于不同人群的心脏外科等专业领域时,如果没有进行本地化调整,可能会面临较大的跨领域泛化能力差距。我们的研究结果表明,直接应用此类模型存在临床风险,并强调了在临床应用前进行模型重新校准或迁移学习以适应特定领域差异的必要性。
急性肾损伤(AKI)是冠状动脉旁路移植(CABG)术后的一种严重并发症。尽管在大型重症监护病房(ICU)数据库上训练的机器学习模型越来越普遍,但它们在现实世界中针对特定外科群体的泛化能力仍不明确。本研究旨在利用通用ICU数据开发一个CABG术后AKI预测模型,并严格评估其在该模型能否应用于独立的心脏外科中心。
本研究采用了一项回顾性双中心研究。开发队列包括来自MIMIC数据库的6,347名CABG术后患者,独立的外部验证队列包括来自徐州医科大学附属医院(AHXY)的534名患者。特征选择采用了最小绝对收缩量和选择算子回归方法。对九种机器学习算法进行了基准测试,最终随机森林模型被选为最优模型。性能评估通过精确度-召回率曲线下面积(PR-AUC)、ROC曲线下面积(AUC)和决策曲线分析来进行。使用SHapley加性解释(SHAP)来解释各特征对预测结果的贡献。
在MIMIC内部测试集中,随机森林模型表现出中等程度的区分能力,PR-AUC为0.888(95%置信区间:0.871–0.904),AUC为0.709。然而,在外部AHXY队列中应用时,模型性能显著下降,PR-AUC降至0.309,AUC降至0.548。这种接近随机的预测性能表明,未经进一步调整,该模型缺乏直接的现实世界泛化能力。SHAP分析确定体重、血清磷酸盐水平和红细胞分布宽度是关键预测因子。性能下降归因于人群间的显著异质性(如BMI差异)以及心脏外科手术特有的病理生理环境,这些因素无法被通用ICU变量完全捕捉。
当将通用ICU模型应用于不同人群的心脏外科等专业领域时,如果没有进行本地化调整,可能会面临较大的跨领域泛化能力差距。我们的研究结果表明,直接应用此类模型存在临床风险,并强调了在临床应用前进行模型重新校准或迁移学习以适应特定领域差异的必要性。