
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的可解释性模型预测肝内胆管癌远处转移风险:一项基于人群的队列研究
【字体: 大 中 小 】 时间:2025年06月19日 来源:Discover Oncology 2.8
编辑推荐:
本研究通过SEER数据库构建了首个基于机器学习(ML)的肝内胆管癌(ICC)远处转移(DM)预测模型,采用LASSO回归、Boruta算法和递归特征消除(RFE)筛选关键变量,开发了8种ML算法。梯度提升机(GBM)模型表现最优(AUC=0.802),SHAP分析揭示手术、N分期、肿瘤分级等10项核心预测因子,并开发了在线计算器(https://bijinzhe.shinyapps.io/icc_dm_shiny/),为临床个性化诊疗提供决策支持。
背景
肝内胆管癌(ICC)作为第二常见的原发性肝癌,具有高度侵袭性和不良预后,其中远处转移(DM)患者中位生存期仅12.9个月。由于缺乏早期诊断标志物,约40%患者确诊时已发生DM。本研究利用SEER数据库(2004-2021年)8536例ICC患者数据(DM占比33%),旨在开发可解释的机器学习(ML)预测模型。
方法
通过三种特征选择方法交叉验证:
采用SMOTE技术解决数据不平衡问题,构建8种ML模型(包括逻辑回归LR、支持向量机SVM、梯度提升机GBM等),通过10轮10折交叉验证优化超参数。模型性能以AUC、AUPRC、Brier评分等评估,并利用SHAP(SHapley Additive exPlanations)进行特征重要性解析。
结果
讨论
结论
本研究建立的GBM模型为ICC患者DM风险提供了高精度、可解释的预测框架,有助于早期识别高危患者并指导个体化干预,最终改善预后。
生物通微信公众号
知名企业招聘