基于机器学习的泛癌免疫治疗患者肝损伤临床预测模型构建与验证

【字体: 时间:2025年07月07日 来源:International Journal of Medical Informatics 3.7

编辑推荐:

  免疫检查点抑制剂(ICI)相关肝损伤是肿瘤免疫治疗面临的重大临床挑战。复旦大学附属中山医院团队通过6种机器学习算法构建预测模型,最终筛选出随机森林(RF)模型表现最优(AUC达0.81),利用SHAP方法实现特征重要性排序,开发出可解释性强、临床友好的早期预警工具,为优化免疫治疗安全管理提供新策略。

  

在肿瘤治疗领域,免疫检查点抑制剂(Immune Checkpoint Inhibitors, ICIs)的出现犹如一场革命,为众多癌症患者带来新生希望。然而随着这类"抗癌神药"的广泛应用,其引发的免疫相关不良事件(irAEs)逐渐成为临床医生面临的棘手难题。其中,ICI相关肝损伤的发生率高达1%-25%,轻则表现为肝功能指标异常,重则可进展为致命性肝衰竭,不仅威胁患者生命安全,还可能导致抗癌治疗中断。更令人担忧的是,现有预测工具多聚焦于整体irAEs或疗效评估,针对肝损伤这一特定毒性的预警系统几乎空白,传统统计模型又存在预测性能有限、无法处理复杂数据关系的缺陷。

为破解这一临床困境,复旦大学附属中山医院的研究团队开展了一项创新性研究。他们收集了2019年3月至2022年9月期间863例接受首次ICI治疗的泛癌种患者数据,运用神经网络(NN)、梯度提升分类器(GBC)、XGBoost等6种机器学习算法,构建了急性肝损伤风险预测模型。通过严谨的5折和10折交叉验证,最终确立随机森林(RF)模型为最优解决方案,并借助SHapley Additive exPlanations(SHAP)方法实现模型可解释性,筛选出最具预测价值的10个关键变量。这项发表于《International Journal of Medical Informatics》的研究,为临床提供了首个专门针对ICI治疗早期肝损伤的智能预警工具。

研究团队采用多阶段建模策略:首先通过分层随机抽样将数据划分为训练集和测试集;随后比较不同算法的预测性能,选用AUC、灵敏度等7项指标全面评估;最终通过SHAP分析揭示各特征贡献度,并采用决策曲线分析(DCA)验证临床效用。所有分析均基于Python的scikit-learn库完成,严格遵循TRIPOD报告规范。

【研究结果】
• 患者特征:纳入的863例患者中22.71%发生肝损伤,原发肝癌占43.80%,肺癌占24.10%。基线ALT>40 U/L和AST>40 U/L者分别占28.04%和30.82%。
• 模型比较:RF模型在测试集表现最优(AUC=0.81,95%CI:0.73-0.90),显著优于逻辑回归等传统方法。
• 特征重要性:SHAP分析显示基线ALT、AST、ALP等肝酶指标及肿瘤类型位居贡献度前列。
• 验证结果:5折和10折交叉验证AUC分别达0.79和0.80,校准曲线显示预测概率与实际风险高度一致。

【结论与意义】
该研究成功开发了首个针对ICI治疗早期肝损伤的机器学习预测模型,其创新性体现在三方面:一是首次将预测时间窗精确锁定在治疗首月,抓住临床干预黄金期;二是突破传统统计局限,利用RF算法捕捉复杂非线性关系;三是通过SHAP解释实现"黑箱"透明化,辅助临床决策。更重要的是,模型仅需常规检验指标即可运行,在资源有限地区也具推广价值。研究者特别指出,该工具可作为ICI治疗前的"安全筛查器"和治疗中的"风险警报器",未来通过多中心验证有望纳入临床指南,为肿瘤免疫治疗安全保驾护航。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号