编辑推荐:
为解决松果体区肿瘤(PRT)因病理类型多样、临床表现各异导致预后判断困难的问题,研究人员基于 SEER 数据库开展多中心研究,构建 7 种机器学习(ML)模型预测 PRT 患者预后。结果显示不同模型对总生存期(OS)和癌症特异性生存期(CSS)预测效果不同,该研究为临床提供决策支持。
在人体这座神秘的 “小宇宙” 里,松果体区就像一个隐藏在深处的神秘角落。松果体区肿瘤(PRT)虽罕见,却有着多样的病理类型和生长特点,就像一群 “调皮的小精灵”,各有各的 “脾气”。它们引发的症状多种多样,常常压迫周围结构,导致脑积水、眼动障碍、听力受损等问题,头疼更是常见症状。而且由于这些症状缺乏特异性,PRT 早期很难被发现,大多是在出现梗阻性脑积水进行颅脑成像时才被揪出来。
PRT 在不同年龄段的发病率差异很大,在成人中发病率仅 0.4%,在儿童中却能达到 2.8% - 11%。它还分为松果体实质肿瘤、生殖细胞肿瘤(GCTs)等多种类型。近年来,虽然对 PRT 的研究逐渐增多,但由于其发病率低、病理和临床表现差异大,以及不同病理类型肿瘤的辅助治疗不同,医生们对患者的预后了解非常有限。
为了打破这一困境,让医生们能更准确地判断 PRT 患者的预后,指导临床治疗,研究人员开展了这项重要的研究。他们借助 SEER 数据库(涵盖美国 47.9% 人口的癌症发病数据),通过深入挖掘其中 PRT 患者的临床信息,进行了一系列研究。最终,研究成果发表在《European Journal of Surgical Oncology》上,为该领域带来了新的曙光。
在研究过程中,研究人员运用了多种关键技术方法。首先,利用 SEER?Stat(8.4.2)软件从 SEER 数据库(2000 - 2020 年,17 个中心,2022 年 11 月版本)提取 PRT 患者数据,并将患者随机按 7:3 分为训练队列和验证队列。接着,采用 Kaplan - Meier(K - M)分析评估患者生存情况,通过单因素和多因素 Cox 回归分析找出影响患者生存的危险因素。在此基础上,构建列线图,并开发了包括决策树、逻辑回归、LightGBM、随机森林(RF)、XGBoost、K 近邻算法(KNN)、支持向量机(SVM)在内的 7 种机器学习模型预测患者预后,运用受试者工作特征曲线下面积(AUC - ROC)、十倍交叉验证、校准曲线和决策曲线分析(DCA)等方法评估模型预测价值。
下面来看看具体的研究结果:
- 危险因素分析:单因素和多因素 Cox 回归分析发现,年龄、组织病理学、放疗和肿瘤大小是总生存期(OS)的独立危险因素;组织病理学、手术、放疗和肿瘤大小则是癌症特异性生存期(CSS)的危险因素。K - M 生存分析显示,年龄、组织病理学、婚姻状况、放疗、性别和手术对 OS 有显著影响;年龄、组织病理学、婚姻状况、种族、放疗、性别和手术对 CSS 影响显著。
- 模型预测效果评估:在预测 OS 方面,随机森林(RF)、逻辑回归和 XGBoost 这三种机器学习模型展现出了最佳的临床效用;对于 CSS 的预测,随机森林(RF)和 LightGBM 表现最为出色。
从研究结论和讨论部分可以看出,该研究意义重大。研究证实了组织病理学类型、放疗和肿瘤大小等因素在 PRT 患者预后中的关键作用,这为临床医生判断患者预后提供了重要依据。同时,多种机器学习模型在预测 PRT 患者术后长期生存方面展现出巨大潜力和较高的预测效能。通过整合 SEER 数据库与先进的机器学习模型,能够精准预测患者 5 年、8 年和 10 年生存率。临床医生可以根据患者的具体情况选择最合适的机器学习预测模型,为后续的临床治疗决策提供更个性化、更客观的指导,让医患沟通更加顺畅、直观。这不仅有助于提高 PRT 患者的治疗效果,还为机器学习在罕见肿瘤领域的应用开辟了新的道路,推动了该领域的进一步发展。