基于H&E染色的脑膜瘤分子分型与结局预测的深度学习:一项回顾性队列研究

《The Lancet Digital Health》:Deep learning for H&E-based meningioma molecular classification and outcome prediction: a retrospective cohort study

【字体: 时间:2026年06月12日 来源:The Lancet Digital Health 24.1

编辑推荐:

  背景 基因组学分型(genomic profiling)作为分子分类和临床结局预测工具的引入,已经彻底改变了脑肿瘤患者的诊疗模式。人工智能(AI)为将复杂基因组信息转化为临床常规可获得的患者层面信息提供了先进路径。本研究旨在评估:深度学习是否能够仅基于苏木

  
背景
基因组学分型(genomic profiling)作为分子分类和临床结局预测工具的引入,已经彻底改变了脑肿瘤患者的诊疗模式。人工智能(AI)为将复杂基因组信息转化为临床常规可获得的患者层面信息提供了先进路径。本研究旨在评估:深度学习是否能够仅基于苏木精-伊红(H&E)染色组织样本,对最常见脑肿瘤——脑膜瘤——进行稳健的分子亚型表征、复发风险预测,并识别关键染色体拷贝数改变。

方法
在这项回顾性、多中心、模型开发与验证研究中,研究人员构建了一个具有配对DNA甲基化(DNA methylation)数据及匹配数字化H&E图像的脑膜瘤队列。该队列包括训练数据集:美国国家癌症研究所(National Cancer Institute,NCI)的真实世界临床病例横断面(n=439),以及加拿大大学健康网络(University Health Network,UHN)的真实世界临床病例数据集(n=166)。另设第二个测试数据集,用于额外临床验证,包括美国梅奥诊所(Mayo Clinic)全切除术后WHO 2级脑膜瘤病例(n=67)。研究人员训练并验证了5个专用深度学习模型,仅使用H&E染色预测以下指标:脑膜瘤分子分型(即分子组1–4[MG1–4],这些分组与相对同质的生物学特征及临床结局相关);3种重要染色体臂非整倍性(1p缺失、1q扩增和22q缺失);以及基于DNA甲基化的5年无进展生存期(progression-free survival,PFS)风险分组(高风险与低风险)。采用受试者工作特征曲线下面积(AUC)和平衡准确率(balanced accuracy)评价分类器性能,并使用log-rank检验比较预测为高复发风险组与低复发风险组之间的PFS差异。

结果
该深度学习分类器在将输出概率阈值设为0·4时,基于H&E染色预测脑膜瘤分子组的平衡准确率达到87%–97%。MG1与其他分子组的AUC为0·98(95% CI 0·97–1·00),MG2与其他分子组为0·96(0·94–0·99),MG3与其他分子组为0·81(0·74–0·88),MG4与其他分子组为0·88(0·83–0·94)。染色体层面改变的AUC分别为:1p缺失0·86(0·80–0·92)、22q缺失0·86(0·79–0·93)、1q扩增0·79(0·65–0·91)。专用结局预测模型在校正WHO分级、切除范围和患者年龄后,仍可对PFS进行预后分层(风险比[hazard ratio, HR] 3·49,95% CI 1·54–7·91;p=0·0028)。

解释
据研究人员所知,本研究首次应用深度学习模型,仅利用H&E染色,在单一脑肿瘤实体(脑膜瘤)中不仅实现诊断外的分子亚型识别,还可进行结局预测。迄今为止,脑膜瘤治疗分层和个体化风险预测仍主要依赖资源消耗较大的基因组学分型。本研究表明,将AI建模应用于常规可获得的H&E染色样本,可在全球范围内推动基因组信息可及性的普及。

资金来源
加拿大卫生研究院(Canadian Institutes of Health Research)和Brain Tumour Charity。
该研究发表于《The Lancet Digital Health》,聚焦脑膜瘤这一最常见原发性脑肿瘤在分子时代下面临的关键临床转化问题。既往研究已经表明,传统WHO分级虽仍是标准诊疗框架的重要组成部分,但难以充分解释脑膜瘤显著的生物学异质性与临床异质性。随着DNA甲基化(DNA methylation)分型和分子分组体系的建立,脑膜瘤已可进一步划分为免疫型分子组1(molecular group 1,MG1)、良性NF2-wildtype分子组2(MG2)、高代谢型分子组3(MG3)和增殖型分子组4(MG4)。这些分子组与不同的生物学通路、复发风险和治疗反应密切相关,其中MG4通常预后最差且对放疗反应有限。然而,现有分子分型和复发风险评估高度依赖基因组学检测,不仅成本高、耗时长,而且主要局限于少数三级转诊中心,导致现代分子工具在全球范围内的可及性不足。与此同时,常规病理工作流程中广泛可得的H&E切片虽然承载丰富形态学信息,却尚未被充分开发用于重建分子层面的分类和预后判断。因此,开展本研究的核心动因,在于检验深度学习能否直接从H&E全视野图像中提取可替代分子检测的高价值信息,以实现脑膜瘤的低成本、快速、可推广的分子分型与结局预测。

研究人员据此设计了一项回顾性、多中心模型开发与验证研究,纳入具有数字化H&E全切片图像及配对DNA甲基化数据的脑膜瘤病例,构建并验证多个深度学习模型。研究显示,仅凭H&E染色图像,模型即可较高准确度预测脑膜瘤分子组、关键染色体臂拷贝数改变以及基于甲基化模型定义的复发风险分层;同时,该模型对无进展生存期(PFS)的预测独立于WHO分级、手术切除范围和年龄。更进一步,研究还利用切片级与瓦片级(tile-level)输出分析肿瘤内部空间异质性,提示H&E深度学习不仅能够近似重建分子结果,还可提供传统整体组学方法难以揭示的肿瘤内部分子空间组织信息。这一结果具有重要意义:其一,说明常规病理图像可作为分子信息代理,推动脑膜瘤精准诊疗工具普及;其二,为放疗获益评估、复发风险管理和临床试验分层提供新的技术基础;其三,也为其他肿瘤建立疾病特异性H&E分子预测模型提供了方法学范式。

作者开展研究所使用的主要关键技术方法,可概括如下:研究队列来源于NCI训练队列、UHN独立外部验证队列及Mayo Clinic临床结局验证队列,其中Mayo队列为WHO 2级且全切除后的脑膜瘤患者。研究人员首先使用Illumina 850K EPIC或EPICv2芯片获得DNA甲基化数据,并据此生成分子组、复发风险和染色体臂改变标签;随后将H&E全切片划分为512×512像素图块,在×20放大倍数下提取图像特征,采用病理学预训练大视觉Transformer基础模型UNI提取每个图块1024维特征;最后,基于多层感知机(multilayer perceptron,MLP)分别训练5个独立分类器,并通过5×5重嵌套交叉验证、外部独立队列验证、生存分析、多变量Cox回归及空间异质性指标分析完成模型评估。

在研究结果部分,论文首先报告了整体队列与模型构建情况。研究共纳入672例脑膜瘤,包括NCI训练队列439例、UHN测试队列166例和Mayo测试队列67例。研究人员围绕5个DNA甲基化衍生标签分别建立独立模型,即分子组、复发风险组、染色体1p缺失、1q扩增和22q缺失预测模型。这一设计使每项任务都具有明确输出目标,并便于考察不同生物学层面的预测能力。

在“分子分型性能评估”方面,研究表明,外部UHN队列中,模型对4种脑膜瘤分子组的识别具有较高判别力。MG1、MG2、MG3、MG4相对于其他组的AUC分别为0·98、0·96、0·81和0·88。若采用0·4的输出概率阈值,仅对置信度较高的病例进行分类,外部测试队列的总体平衡准确率由81%提高至87%,覆盖率为80%。若将临床结局相近的MG3和MG4合并为单一恶性组,则平衡准确率进一步提高,在UHN队列总体可达94%,使用0·4阈值时达97%。这一结果说明,H&E深度学习模型能够有效识别脑膜瘤的核心分子生物学类别,并在更具临床实用性的三分类框架下达到更高精度。

在“复发风险与染色体改变预测”方面,研究人员发现,H&E模型预测甲基化定义的高低复发风险组时,UHN队列AUC为0·81。对关键细胞遗传学改变的预测同样具有较高准确性:1p缺失与22q缺失的AUC均为0·86,1q扩增为0·79。由于这些染色体臂水平改变已知与脑膜瘤分子组、WHO分级补充分层及临床预后密切相关,这一结果表明模型不仅能作分型判断,还能从形态学层面推断重要分子病理事件。

在“模型内部一致性与生物学合理性”方面,研究人员比较了5个独立模型在UHN队列中的输出一致性。结果显示,预测为MG4的肿瘤最可能同时被预测为高复发风险,其次为MG3,而MG1与MG2最低,这与不同分子组已知的预后梯度一致。类似地,1p缺失在MG3和MG4中预测概率较高;22q缺失在MG2中显著较低,这与MG2并非由NF2失活驱动的定义相吻合;1q扩增则在MG4中最为突出。上述发现说明,各模型虽独立训练,但能够共同再现脑膜瘤分子组已知的生物学与临床图谱,支持模型输出具有较好的内部一致性和生物学可信度。

在“临床预后验证”方面,研究进一步检验了H&E模型在真实临床结局预测中的价值。UHN外部验证队列显示,基于H&E预测的高低复发风险组,其PFS曲线分离效果与基于DNA甲基化模型得到的风险分层相近,二者log-rank检验均达到显著性。进一步按WHO分级(1级与2级)及切除范围(全切除与次全切除)分层后,H&E风险模型仍保持显著预后分层能力。多变量Cox回归分析显示,在校正年龄、WHO分级和切除范围后,H&E模型定义的高复发风险组仍与较差PFS独立相关,HR为3·49。Mayo独立验证队列全部为WHO 2级且全切除患者,在这一相对同质且临床上具有挑战性的亚群中,H&E模型同样将患者区分为显著不同的PFS组别,高风险组中位PFS为6·86年,低风险组为14·64年。该结果强调,该模型不仅补充传统病理分级,而且可能在现有临床决策框架中提供独立而实用的预后信息。

在“肿瘤内异质性解析”方面,研究利用瓦片级分子组输出,对脑膜瘤切片内部空间异质性进行了定量评估。研究人员设置了整体同质性评分、相邻瓦片同质性评分、Moran’s index和Altieri’s entropy等指标,以表征切片内分子预测的空间组织状态。结果显示,MG1、MG2和MG4的同质性评分显著高于MG3,提示MG3具有更高的空间异质性。利用Moran’s index和Altieri’s entropy得到的趋势与此一致,即MG3更可能表现出分子空间构成的复杂性和过渡性。研究还发现,H&E预测与甲基化真实标签一致的样本通常具有更高同质性、更高空间自相关和更低空间熵,说明异质性较低的切片更容易获得稳健可靠的H&E分子预测。该分析不仅提升了模型可解释性,也提示在异质性很高、置信度较低的病例中,仍可考虑进一步进行DNA甲基化检测作为补充。

讨论部分指出,本研究的核心贡献在于首次证明,深度学习可仅凭H&E切片,对单一中枢神经系统肿瘤实体——脑膜瘤——进行高准确度分子分型和结局预测,并可识别与预后相关的关键染色体改变。作者强调,这一策略突破了分子检测成本高、可及性差和周转时间长的现实限制,使常规病理图像有望承担分子时代精准诊疗入口的功能。研究同时表明,模型可揭示肿瘤内部的空间分子异质性,尤其提示MG3可能代表介于良性组与增殖组之间、具有更高异质性的生物学状态,这为今后围绕分子组特异性治疗脆弱性的研究提供了新线索。作者也坦陈研究局限,包括回顾性设计、人口学信息不完整、深度学习可解释性有限、缺乏组织形态学层面的人工“金标准”对照等,因此仍需更大规模、多中心、前瞻性研究加以验证,并评估跨人群推广性及与其他模态数据整合的潜力。

研究结论部分可概括翻译如下:研究人员构建并公开了基于H&E的深度学习模型,可在无需全基因组分子检测的情况下,从脑膜瘤常规病理切片中快速、低成本地提取分子分组、细胞遗传学异常及复发风险信息。该框架有望将脑膜瘤分子时代的诊疗能力从少数具备高级分子平台的三级中心扩展至更广泛的临床环境,促进分子分层临床试验开展,并为其他癌种建立类似疾病特异性模型奠定基础,从而推动个体化医疗成为新的标准诊疗模式。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号