基于线性机器学习的预测模型:精准预估胶质母细胞瘤患者生存期

【字体: 时间:2025年03月08日 来源:Acta Neurochirurgica 1.9

编辑推荐:

  研究人员为预测胶质母细胞瘤(GBM)患者生存期,构建基于 MGMT 甲基化状态等的模型,线性算法预测更准,意义重大。

  

胶质母细胞瘤患者生存期预测的新突破

在医学领域,脑部肿瘤一直是困扰患者和医生的难题。胶质母细胞瘤(Glioblastoma multiforme,GBM)作为成人中最常见的原发性恶性脑肿瘤,其发病率约为每 10 万人中有 3 例。尽管目前采用了最大安全范围的手术切除,以及术后同步放化疗等手段,但 GBM 患者的预后情况依旧很差,两年生存率仅为 27%,五年生存率更是只有 5% 。
近年来,分子诊断在临床中的地位日益重要,可作为预后标志物影响治疗决策。其中,O6- 甲基鸟嘌呤 - DNA 甲基转移酶(O6-Methylguanine-DNA Methyltransferase,MGMT)启动子的甲基化状态,对治疗策略的选择有着重要意义。当 MGMT 启动子甲基化时,MGMT 酶的表达会沉默,降低肿瘤修复 DNA 损伤的能力,进而影响患者的生存期。然而,对于不同 MGMT 甲基化状态的影响,尤其是在不一致甲基化的情况下,仍存在许多未知。
与此同时,机器学习在肿瘤研究领域逐渐崭露头角。它能够预测个体的结果,而不是群体的平均值或中位数。但开发一个有效的基于临床参数(如治疗方案、MGMT 甲基化状态等)的机器学习模型,来预测患者的生存期,仍然是一个巨大的挑战。
为了攻克这一难题,德国明斯特大学医院(University Hospital Münster)的 Emanuele Maragno、Sarah Ricchizzi 等人开展了一项研究。该研究成果发表在《Acta Neurochirurgica》上,为 GBM 患者生存期的预测提供了新的思路和方法。

研究方法

  1. 研究对象:研究人员收集了 2015 年至 2018 年在明斯特大学医院神经外科接受手术治疗的 253 例 GBM 成年患者的数据。经过筛选,最终纳入 218 例患者进行分析,确保所有患者的信息完整,以避免数据缺失导致的不准确。
  2. 组织病理学分析:从每个组织学样本中提取 DNA,通过甲基化特异性聚合酶链反应(MS-PCR)对 DNA 进行分析,将肿瘤分为真正甲基化、未甲基化和不一致甲基化三组。具体判断标准为:MS 带浓度 <0.1 ng/μL 为未甲基化,>0.5 ng/μL 为甲基化,介于 0.1 - 0.5 ng/μL 之间为不一致甲基化。
  3. 统计分析:运用 IBM SPSS(Version 29.0.2)软件,采用方差分析(ANOVA)模型进行单变量统计分析。将 MGMT 甲基化作为三因素模型,同时纳入年龄和性别作为协变量,预测患者的总生存期(Overall Survival,OS),以 p<0.05 为具有统计学意义。
  4. 机器学习模型构建:使用 Python 3.8 编程语言在 PHOTONAI 机器学习平台上构建模型。研究人员采用了五种不同的算法,其中包括三种线性模型(线性回归、线性支持向量回归)和两种非线性模型(随机森林、K 近邻算法)。通过嵌套的 10 折交叉验证(重复 5 次)来优化模型的超参数,并使用均方误差(MSE)、平均绝对误差(MAE)、解释方差(EV)、皮尔逊相关系数(PC)和 R2等指标评估模型性能。此外,还进行了特征重要性分析,以确定对预测模型影响最大的变量,并通过置换检验评估模型性能的显著性。

研究结果

  1. 研究对象基本信息:218 例患者中,男性 123 例,女性 95 例,年龄在 25 - 84 岁之间,中位年龄为 64 岁。95.4% 的患者接受了 Stupp 方案治疗,4.6% 的患者仅接受了放疗。所有患者的总生存期在 0 - 101 个月之间,中位生存期为 21 个月。
  2. 统计分析结果:通过 ANOVA 模型分析发现,MGMT 甲基化与总生存期显著相关(F (2,213)=3.6 ,p=0.029)。
  3. 机器学习分析结果:在所有算法中,线性回归表现最佳,其 MAE 为 12.65,MSE 为 296.26。与零信息率模型(MAE=13.65,MSE =323.39)相比,线性回归模型具有更好的预测稳定性。整体上,线性算法的预测结果优于非线性算法。
  4. 特征重要性分析结果:年龄对预测的影响最大(重要性 (mean) 1.45 SD ± 1.02),其次是 MGMT 甲基化阳性(重要性 (mean)=0.29 SD ± 0.39),而 MGMT 甲基化阴性对预测的影响最小。中间状态的 MGMT 甲基化对模型的影响较小(重要性 mean =0.14,Rank =3)。

研究结论与意义

该研究表明,基于年龄、性别和 MGMT 甲基化状态等关键参数,运用线性机器学习技术构建的模型,能够有效预测 GBM 患者的生存期。虽然研究存在一些局限性,如数据收集的回顾性、样本量的限制以及 MGMT 检测方法和临界值的争议等,但这一研究为 GBM 患者生存期的预测提供了新的方向。
该研究确认了 MGMT 甲基化状态对 GBM 患者预后的影响,阳性 MGMT 甲基化对预后有积极影响,而中间状态的 MGMT 甲基化在总生存期的预后价值上影响较小。这一发现为后续研究指明了方向,未来应进一步探究中间状态 MGMT 甲基化对预后和治疗方法的影响。此外,研究还强调了多学科合作以及前瞻性研究的重要性,通过医院、病理中心和数据科学家的紧密合作,扩大患者队列,提高模型的可比性和准确性,有望为 GBM 患者的临床治疗提供更精准的指导,改善患者的预后情况。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号