
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习构建肝门部胆管癌根治术后生存预测列线图模型的开发与验证
【字体: 大 中 小 】 时间:2025年07月13日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对肝门部胆管癌(hCCA)预后评估难题,通过机器学习算法筛选出切缘阳性、淋巴结转移、淋巴结清扫数目(TLNC)低和肿瘤分化差等关键预后因素,构建了预测1-3年总生存期(OS)的列线图模型。该模型C-index达0.731,显著优于传统TNM分期系统,为hCCA患者术后个体化预后评估提供了可靠工具。
肝门部胆管癌(hCCA)作为胆道系统罕见的恶性肿瘤,其发病率虽仅为0.6-2/10万,却因解剖位置复杂、手术切除率低而预后极差。即便接受根治性切除,患者5年生存率也仅11-40%,中位生存期不足25个月。更棘手的是,约半数患者术后会出现切缘阳性,而现有的TNM分期和Bismuth-Corlette分型在预后预测方面表现欠佳,临床亟需更精准的预测工具。
针对这一临床难题,西安交通大学第一附属医院肝胆外科的研究团队开展了一项创新性研究。他们收集了2010-2021年间340例接受根治性切除的hCCA患者数据,运用五种机器学习算法(LASSO回归、前向逐步Cox回归、Boruta特征选择、随机森林和XGBoost)筛选预后因素,最终构建了基于四个关键变量的列线图模型。这项重要成果发表在《Scientific Reports》上,为hCCA的个体化预后评估提供了新范式。
研究采用回顾性队列设计,纳入标准包括术后病理确诊hCCA、临床资料完整且无其他恶性肿瘤。通过7:3比例随机分为训练集(237例)和验证集(103例)。主要采用机器学习算法进行变量筛选,构建包含切缘状态、淋巴结转移、TLNC和肿瘤分化的列线图,并通过C-index、校准曲线、ROC曲线和决策曲线等多维度验证模型性能。
变量筛选结果显示,五种机器学习算法一致锁定四个核心预后因素:切缘阳性(定义为R1切除)使死亡风险增加1.8倍;淋巴结转移(N1/N2)患者预后显著差于N0;TLNC≤6提示不良预后;低分化肿瘤的生存期明显缩短。这些发现揭示了手术质量和肿瘤生物学特征对预后的决定性影响。
模型性能方面,训练集的C-index达0.731(95%CI:0.684-0.753),验证集为0.714(95%CI:0.661-0.775),显著优于TNM分期(0.621)和Bismuth分型(0.531)。3年OS的AUC在训练集和验证集分别达到0.784和0.770,校准曲线显示预测与实际观察值高度吻合。决策曲线分析证实该模型具有显著的临床净获益。
风险分层应用显示,按列线图评分可将患者分为低、中、高三组,训练集中三组中位OS分别为39.3、24.1和10.3个月(p<0.001),验证集结果相似(43.4、20.9和10.3个月)。这种分层为术后辅助治疗决策提供了量化依据。
该研究首次将机器学习应用于hCCA预后模型构建,其创新性体现在三方面:一是通过算法一致性筛选确保变量选择的可靠性;二是整合手术质量指标(TLNC、切缘状态)和肿瘤生物学特征(分化程度);三是模型可视化程度高,便于临床直接应用。研究同时发现,当TLNC≥12时预后改善趋于平缓,这为规范淋巴结清扫范围提供了循证依据。
值得注意的是,与传统认知不同,该研究提示切缘状态的预后价值可能独立于淋巴结转移,这与部分近期研究结论形成对话。作者建议在技术可行时应联合尾状叶切除以提高R0切除率,同时强调需开展多中心研究验证这一发现。
作为单中心回顾性研究,该成果存在一定局限,如未考虑手术年份对预后的影响、化疗方案不统一等。未来研究可整合影像组学、分子标志物等多模态数据进一步提升预测精度。尽管如此,这项研究仍为改善hCCA患者管理迈出了重要一步,其构建的列线图模型有望成为临床实践的有力工具。
生物通微信公众号
知名企业招聘