用于预测上皮性卵巢癌复发时间的机器学习生存模型

《Gynecologic Oncology》:Machine-learning survival models for predicting time to recurrence in epithelial ovarian cancer

【字体: 时间:2025年12月06日 来源:Gynecologic Oncology 4.1

编辑推荐:

  本研究评估了五种机器学习生存模型预测卵巢癌患者复发时间的有效性。采用全量随访时间和15个月限制数据分别训练模型,发现GBSA在长期预测中表现最佳(CD-AUC>0.8),而DeepSurv和RSF在短期预测中更优。显著预测因素包括晚期分期、HRD阴性、新辅助化疗及CA125升高。

  
约翰·中山(John Nakayama)| 迈克尔·麦高希(Michael McGaughey)| 格蕾丝·平佐拉(Grace Pindzola)| 艾尔文·米勒(Eirwen Miller)| 托马斯·克里瓦克(Thomas Krivak)| 克里斯托弗·莫尔斯(Christopher Morse)| 莎拉·克拉夫顿(Sarah Crafton)| 艾丽莎·韦尔德(Alyssa Wield)| 杰弗里·图尔(Jeffrey Toole)| 蒂芙尼·萨默斯凯尔斯(Tiffany Summerscales)
美国宾夕法尼亚州匹兹堡市阿勒格尼健康网络(Allegheny Health Network, Pittsburgh, PA, USA)

摘要

目的

评估机器学习生存模型利用患者前线化疗完成时已知的医疗记录信息预测复发时间的有效性。

方法

五种生存模型——惩罚性Cox比例风险模型(PenCoxPH)、随机生存森林模型(RSF)、梯度提升生存分析模型(GBSA)、DeepSurv和FastCPH——在医疗记录数据上进行了训练,用于预测复发时间。这些模型既在所有患者数据上进行了训练,也在仅限于晚期(III期和IV期)患者的数据上进行了训练。它们既使用了完整复发时间的数据,也使用了短期复发时间的数据(限制在15个月内),以提高前线化疗完成后第一年的预测准确性。评估了PenCoxPH模型的特征风险比。

结果

在预测完整复发时间方面,GBSA的表现最好;而DeepSurv和RSF模型在预测短期复发方面表现最佳。GBSA在2年和3年时的CD-AUC(累积/动态AUC)值均超过0.8。I期、HRD阴性、NACT以及前线化疗期间CA125水平的升高是复发的显著预测因素。对于晚期、高级别浆液性肿瘤患者,PenCoxPH和FastCPH在6个月时的CD-AUC值为0.74。

结论

机器学习生存模型能够以足够的准确性预测复发时间,具有临床应用价值。尽管需要验证性研究来确认这些发现,但医疗提供者可以利用这些信息来定制维持治疗策略,并选择患者参加临床试验。

引言

上皮性卵巢癌是最致命的妇科恶性肿瘤[1]。治疗选择和肿瘤检测技术的进步使得个性化治疗计划的发展成为可能[2]。例如,贝伐单抗和PARP抑制剂(PARPi)的维持治疗在前线治疗和复发治疗中改善了无进展生存期(PFS)。然而,总体生存结果并不一致[[3], [4], [5], [6]]。目前,BRCA突变和同源重组缺陷(HRD)状态是指导PARPi使用的依据,但在PRIMA研究中约24%的HRD患者[7]以及SOLO1研究中约9%的BRCA突变患者[8]在开始治疗后6个月内出现疾病进展。临床医生迫切需要新的方法来识别适合靶向治疗的患者以及复发风险最高的患者,从而更好地制定治疗决策。
铂类药物敏感性是预测PARPi敏感性的最佳指标之一,也是指导二线治疗决策的依据[[9], [10], [11]]。机器学习(ML)提供了一种预测患者预后的新方法,包括预测铂类药物敏感性。
在卵巢癌领域,ML模型通常基于影像学资料、病理切片和有限的临床信息进行训练,以对组织类型进行分类、诊断并预测治疗结果[[12], [13], [14], [15], [16]]。常用的ML方法是人工神经网络(ANNs),因为它们能够处理复杂的数据(如图像)[17,18]。这些研究通常旨在执行分类任务(例如评估肿瘤减缩能力),或使用专门的检测方法(例如专门的基因组/蛋白质组学检测),但这些方法在临床上并不常用[[14], [15], [16]]。评估PFS并提供足够临床信息的ML研究,其AUC值通常在0.61到0.63之间[[19], [20], [21]]。在3年和5年生存率的预测中观察到更高的AUC值[21],尤其是在主要针对早期患者的研究中(外部验证AUC为0.70),因为这些患者的预后更容易预测[22]。
我们的目标是使用经过验证的先进ML回归生存模型[23]来预测复发时间(TTR),以更准确地量化患者风险并指导治疗决策。我们力求提供一个适用于所有疾病阶段的通用模型,特别是针对复发风险较高的晚期疾病。此外,模型中仅包含了可以从医疗记录中轻松获取的特征,无需额外的检测(如专门的图像分析或超出BRCA和HRD状态的蛋白质组学/基因组学检测),以确保模型可以使用标准医疗信息进行实施。虽然还需要进一步的外部验证,但该项目将为ML预测卵巢癌预后的能力提供有价值的数据,并为解决具体临床问题的未来研究提供参考。

方法部分

方法

该队列包括479名患者,他们的病理报告显示在2017年1月至2023年10月期间被诊断为上皮性卵巢癌,这些患者的信息存储在阿勒格尼健康网络的电子医疗记录(EMR)系统中。本研究已获得伦理委员会(IRB)的批准。
我们纳入了被诊断为上皮性卵巢癌(EOC)的患者,包括高级别浆液性、子宫内膜样、癌肉瘤、透明细胞和黏液性组织类型的肿瘤,以及所有分期患者。我们将研究对象限制在具有以下三个特征的患者中:

结果

由479名上皮性卵巢癌患者组成的队列中,336名为晚期(III/IV期)患者,详见表1。表1列出了每个二元特征的患者数量,并总结了数值特征的最大值、中位数和最小值。
在我们的患者群体中,221名患者(198名为晚期患者)出现了复发,其余患者的数据被截断。在141名I期和II期患者中,只有22名患者的复发情况已知(其中2名患者……)

讨论

卵巢癌的临床现实是,大多数晚期卵巢癌患者最终都会复发并因疾病而死亡[37]。尽管靶向疗法的出现带来了显著进展,但仍需要新的方法来持续推动治疗的发展。临床医生通过整合客观数据(如CA-125水平、肿瘤减缩情况等)来直观地对患者进行分类,从而制定复发风险和治疗计划。然而,机器学习无法进行身体检查……

CRediT作者贡献声明

约翰·中山(John Nakayama):撰写初稿、监督、概念构思。迈克尔·麦高希(Michael McGaughey):软件开发、正式分析。格蕾丝·平佐拉(Grace Pindzola):数据调查、数据整理。艾尔文·米勒(Eirwen Miller):撰写、审稿与编辑、资源协调。托马斯·克里瓦克(Thomas Krivak):撰写、审稿与编辑、资源协调。克里斯托弗·莫尔斯(Christopher Morse):撰写、审稿与编辑、资源协调。莎拉·克拉夫顿(Sarah Crafton):撰写、审稿与编辑、资源协调。艾丽莎·韦尔德(Alyssa Wield):撰写、审稿与编辑、资源协调。杰弗里·图尔(Jeffrey Toole):监督、项目管理。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文的研究结果。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号