编辑推荐:
为解决成人弥漫性胶质瘤分子亚型和分级预测难题,研究人员开发 GlioMT 模型,其性能优异,助力临床决策。
在大脑这个神秘的 “宇宙” 中,胶质瘤就像一颗颗隐藏的 “暗星”,威胁着人类的健康。成人弥漫性胶质瘤是最常见的原发性恶性脑肿瘤,准确判断其分子亚型和分级,对于制定治疗方案和预估患者预后至关重要。
以往,通过基因检测来确定分子亚型和分级,就像是在黑暗中摸索,不仅成本高、耗时长,在资源有限的地区甚至难以开展。而且,活检时组织不足还会导致诊断不完整。依靠磁共振成像(MRI)特征结合深度学习(DL)进行预测的方法,虽然带来了一丝曙光,但大多数基于 2016 年 WHO 分类的研究,纳入了不符合 2021 年 WHO 分类标准的肿瘤,并且传统卷积神经网络(CNNs)在捕捉 MRI 数据全局信息上存在缺陷。因此,开发一种更先进、可靠的方法迫在眉睫。
来自韩国延世大学等机构的研究人员,踏上了探索之旅,开展了一项极具意义的研究。他们致力于开发并验证一种强大且可解释的多模态 Transformer 模型 —— 胶质瘤多模态 Transformer(GlioMT),以根据 2021 年 WHO 分类对成人弥漫性胶质瘤进行分子亚型和分级预测。该研究成果发表在《npj Digital Medicine》上。
研究人员在这场探索中,使用了多种关键技术方法。首先,精心筛选患者队列,从 2005 年 6 月至 2022 年 12 月,在延世大学 Severance 医院收集 1226 例弥漫性胶质瘤患者作为机构开发集,经过严格的纳入和排除标准筛选,最终确定 1053 例成人弥漫性胶质瘤患者纳入机构数据集;同时,从癌症基因组图谱(TCGA)和加州大学旧金山分校(UCSF)数据集获取外部验证集患者。其次,利用 3.0-T MRI 扫描仪对患者进行术前扫描,获取多种 MRI 序列图像,并进行一系列预处理操作。然后,通过自动肿瘤分割和切片选择流程,为模型训练准备数据。最后,构建并训练 GlioMT 模型,与传统 CNNs 和视觉 Transformer 进行对比评估。
下面来看看他们的研究成果:
- 患者特征:研究涉及机构数据集(n=1053)、TCGA 外部验证集(n=200)和 UCSF 外部验证集(n=477)。尽管三个队列的性别分布无统计学差异,但年龄、分子亚型、中枢神经系统(CNS)WHO 分级和 O6- 甲基鸟嘌呤 - DNA 甲基转移酶启动子(MGMTp)甲基化状态存在显著差异,体现了真实世界数据集的异质性。
- MR 图像预处理:为确定模型训练的最佳输入切片数量,研究人员进行了一系列实验。对于预测异柠檬酸脱氢酶(IDH)突变和 1p/19q 共缺失状态,使用肿瘤面积前 75% 的轴向切片训练和评估模型,可获得最高曲线下面积(AUC);对于肿瘤分级预测任务,使用前 50% 的切片效果最佳。
- 模型性能比较:在所有预测任务中,GlioMT 表现出色,优于传统 CNNs 和视觉 Transformer。在预测 IDH 突变状态时,GlioMT 在 TCGA 和 UCSF 数据集上的 AUC 分别达到 0.915 和 0.981;预测 1p/19q 共缺失状态时,AUC 分别为 0.854 和 0.806;预测肿瘤分级时,AUC 分别为 0.862 和 0.960。
- 临床数据编码有效性:利用预训练的 BERT 进行临床数据编码的 GlioMT 模型,在多项任务上实现了最高平均 AUC(0.896),证明了该编码方式的有效性。
- GlioMT 的可解释性:GlioMT 生成的注意力图能清晰突出肿瘤区域,在 85.9% 准确分类的病例中,模型的精度得分超过 0.5。同时,研究还量化了各模态的贡献,发现成像特征对模型预测影响最大,其次是年龄和性别。
在研究结论与讨论部分,GlioMT 展现出巨大优势。它在预测成人弥漫性胶质瘤方面性能卓越,为临床应用带来了希望。其可解释性通过注意力图和数据贡献展示,有助于医生理解模型决策过程,提高临床决策的准确性。然而,研究也存在局限性,如基于 2D 而非 3D 模型,未整合先进成像序列。但总体而言,GlioMT 整合成像和临床数据,在成人弥漫性胶质瘤的分子亚型和分级预测中表现稳健,为未来精准医疗的发展提供了重要参考,有望成为照亮胶质瘤诊疗之路的一颗 “明星”。