基于机器学习与多中心验证的胃癌预后预测模型开发及临床转化研究

《Langenbeck's Archives of Surgery》:Development and validation of a machine learning–based prognostic model for gastric cancer: a multicenter retrospective study

【字体: 时间:2025年11月21日 来源:Langenbeck's Archives of Surgery 2.1

编辑推荐:

  本研究针对传统TNM分期系统在胃癌预后预测中的局限性,开发了整合随机生存森林(RSF)与CoxBoost算法的机器学习模型。通过SEER数据库及中国双中心21,559例患者数据验证,该模型在总体生存(OS)和癌症特异性生存(CSS)预测中显著优于传统分期(C-index达0.719),为个体化治疗决策提供精准工具。

  
在全球癌症负担排名中,胃癌始终位居消化道恶性肿瘤发病率和死亡率的首位。尽管手术切除仍是目前唯一可能根治胃癌的手段,但术后患者的生存结局却存在巨大差异。传统的AJCC TNM分期系统虽被广泛用于预后评估,却存在明显短板——它仅依赖肿瘤解剖学特征,而忽视了年龄、性别、肿瘤大小、组织学类型等众多临床因素对生存的影响。更关键的是,传统生存分析方法如Cox比例风险模型,严格假设风险函数呈比例且变量与结局间为线性关系,这在实际复杂的临床场景中往往难以成立。
正是在这样的背景下,机器学习技术为胃癌预后预测带来了新的曙光。它能够自动从高维复杂数据中学习模式,处理非比例风险和非线性关系,从而提供更灵活、更精准的预测。然而,现有研究多集中于影像诊断或病理图像分析,利用机器学习进行胃癌生存预测、尤其是经过大规模外部验证的研究仍较为缺乏。为此,关晓、刘金松、徐磊等研究人员联合开展了一项大规模回顾性研究,旨在开发并验证一套稳健的机器学习预测模型,以提升胃癌患者术后生存预测的准确性。该成果已于《Langenbeck's Archives of Surgery》正式发表。
研究人员为完成这一目标,整合了来自美国SEER数据库(2000–2018年)的21,559例患者数据,以及来自中国两家医疗中心(2005–2018年)的3,805例患者数据,构成多中心回顾性队列。他们采用三种特征选择方法(Cox回归、随机生存森林RSF、CoxBoost)和四种建模算法(Cox、RSF、CoxBoost、DeepSurv_Cox),分别构建针对总体生存(OS)和癌症特异性生存(CSS)的预测模型。通过五折交叉验证、C-index、IBS(积分Brier分数)和平均AUC等指标全面评估模型性能,并将表现最优的基模型集成为 stacking 集成模型,最终与TNM分期系统进行多维度比较。
研究结果
研究人群与特征
共纳入25,364例胃癌患者,SEER队列与中国队列在年龄、性别、收入、肿瘤部位、治疗方式等基线特征上均存在显著差异(所有p<0.01),凸显了跨人群验证的必要性。
特征选择结果
三种特征选择方法分别筛选出与OS和CSS显著相关的变量,数量在11–14个之间,涵盖年龄、肿瘤TNM分期、治疗方式等多类因素,为后续建模奠定基础。
OS预测性能
在所有队列中,机器学习模型均一致优于深度学习模型。其中RSF算法表现尤为突出,结合CoxBoost或RSF特征选择时,C-index在训练、测试和验证集中分别达到0.758–0.762、0.740–0.744和0.742–0.744。
集成模型进一步提升了预测稳健性,其训练/测试/验证集的C-index分别为0.762/0.738/0.743,IBS为0.127/0.139/0.141,平均AUC达0.858/0.812/0.823。在3年、5年和10年OS预测方面,集成模型的AUC均超过0.80,显著优于TNM分期系统。
CSS预测性能
CSS预测呈现类似趋势。RSF模型在搭配CoxBoost或RSF特征选择后表现最佳,训练集C-index可达0.781–0.789,验证集为0.765–0.770。集成模型在CSS预测中同样全面领先TNM系统,其3年、5年、10年CSS预测AUC均高于0.85。
校准曲线和决策曲线分析(DCA)进一步证实集成模型具有良好的校准度和临床适用性。
结论与讨论
本研究系统构建并验证了一套基于机器学习的胃癌预后预测模型,在国际与中国人群中均展现出优于传统TNM分期及深度学习方法的预测性能。集成模型不仅能更准确地区分高风险与低风险患者,还可提供3年、5年、10年等不同时间点的生存概率,为临床医生制定个体化辅助治疗策略、随访计划和患者沟通提供重要依据。
值得注意的是,深度学习模型(DeepSurv_Cox)在本研究中未表现出预期优势,提示在结构化临床数据场景下,传统机器学习算法如RSF和CoxBoost可能在性能与可解释性之间取得更好平衡。尽管该研究受限于回顾性设计及部分变量(如分子标志物)的缺失,其跨人群验证框架与多模型比较策略仍为胃癌预后研究树立了新标准。未来整合多组学数据与实时临床信息的动态预测模型,有望进一步推动精准外科与肿瘤个体化治疗的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号