基于不确定性感知基础模型集成的新方法精准区分胶质母细胞瘤与其病理 mimics

【字体: 时间:2025年09月30日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对胶质母细胞瘤(GBM)与原发性中枢神经系统淋巴瘤(PCNSL)病理诊断中存在的形态学重叠和高误诊率问题,开发了不确定性感知病理图像快速评估系统(PICTURE)。该系统通过集成九种前沿病理基础模型,结合贝叶斯推断、深度集成和标准化流技术,在2141张全球多中心病理切片上实现了AUROC达0.989的精准鉴别,并在五个独立队列(AUROC=0.924-0.996)得到验证。PICTURE不仅能有效识别67种罕见中枢神经系统肿瘤,还首次实现了对冰冻切片的准确诊断,为术中快速病理决策提供了可靠工具。

  
在神经肿瘤学领域,胶质母细胞瘤(glioblastoma, GBM)和原发性中枢神经系统淋巴瘤(primary central nervous system lymphoma, PCNSL)的鉴别诊断一直困扰着临床医生。尽管这两种恶性肿瘤的治疗方案截然不同——GBM以手术切除为主,而PCNSL对放化疗敏感——但它们在常规病理切片中展现出惊人的形态学相似性。据统计,9.7%-46.2%的术中冰冻切片诊断与最终石蜡切片诊断不符,甚至经验丰富的神经病理学家在FFPE切片诊断中的观察者间差异率也高达16%。这种诊断不确定性可能导致灾难性后果:误将PCNSL患者进行扩大切除会造成神经功能损伤,而延误GBM的手术时机则会显著缩短患者生存期。
面对这一挑战,由哈佛医学院Kun-Hsing Yu教授领导的多国研究团队在《Nature Communications》发表了突破性研究成果。研究人员开发了名为PICTURE(Pathology Image Characterization Tool with Uncertainty-aware Rapid Evaluations)的人工智能系统,通过集成多种前沿技术和多中心大规模数据,实现了对这两种易混淆肿瘤的精准区分,同时还能识别罕见的中枢神经系统(CNS)肿瘤类型。
本研究采用了多项创新技术方法:收集来自梅奥诊所、宾夕法尼亚大学医院等五个医疗中心的2141张病理切片(包括1760张FFPE永久切片和381张冰冻切片);使用九种自监督病理基础模型(CTransPath、Phikon、Lunit、UNI、Virchow2、CONCH、GPFM、mSTAR和CHIEF)进行特征提取;采用三种不确定性量化方法(贝叶斯推断、深度集成和标准化流)提高模型泛化能力;通过正常化流技术实现分布外样本检测。
PICTURE区分PCNSL和胶质母细胞瘤并在患者队列中具有更高泛化能力
研究人员首先使用标准计算病理学流程训练基线模型,包括九种最先进的基础模型和标准的端到端弱监督Swin Transformer。以梅奥诊所的FFPE切片作为模型开发集,PICTURE在保留测试集上实现了接近完美的性能(平均AUROC为0.998),显著优于未使用不确定性量化或集成的基础模型。在四个独立验证队列中,PICTURE表现出 consistently 的高性能:在宾夕法尼亚大学医院(UPenn)队列中AUROC为0.996,在布莱根妇女医院(BWH)队列中为0.987,在维也纳医科大学队列中为0.992,在台北荣民总医院(TVGH)队列中为0.992。虽然标准Swin Transformer在梅奥诊所的保留集上表现尚可,但在独立验证队列中泛化能力显著下降。
PICTURE实现胶质母细胞瘤和PCNSL的准确冰冻切片诊断
考虑到冰冻切片评估在术中区分GBM和PCNSL的重要临床意义,研究人员进一步检验了PICTURE基于术中获取的冰冻切片进行诊断的能力。使用来自独立患者队列的冰冻切片样本,PICTURE在UPenn队列中AUROC达到0.958,在BWH队列中为0.987,在维也纳医科大学队列中为0.982,在TVGH队列中为0.924。Bootstrap显著性检验显示,除UPenn队列外,冰冻切片的性能通常没有显著低于同一医疗中心的FFPE样本。
FFPE和术中诊断的观察者间变异性
为评估区分PCNSL和GBM的临床挑战性,研究人员开发了基于网络的用户界面并进行了一项多机构研究以量化观察者间变异性。九名委员会认证的神经病理学家来自美国、欧洲、东亚和东南亚,代表不同临床经验水平(三名初级<5年、四名中级5-15年、两名高级>15年)。研究结果显示,与地面真相的一致性因个体而异,FFPE切片的Jaccard相似性评分范围为0.56-0.87,冰冻切片为0.49-0.81。观察者间一致性为轻微至中等,FFPE的Fleiss' kappa值为0.271,冰冻切片为0.248。
不确定性量化增强计算病理学评估机器学习模型的泛化能力
为更好地理解PICTURE在先前未见患者群体中的性能稳定性,研究人员检查了特征空间和训练集与独立验证集的量化诊断不确定性。通过CTransPath提取的梅奥诊所形态学特征二维投影显示,具有低诊断不确定性的GBM和PCNSL病理图像占据 distinct 空间。从医学文献收集的图像原型捕获了GBM和PCNSL形态学的多样化表征,有助于有效的模型开发。
PICTURE检测模型训练过程中未遇到的CNS癌症类型
尽管区分GBM和PCNSL具有重要临床意义,但它们只是临床实践中遇到的众多CNS癌症类型中的两种。根据WHO分类的最新版本,定义了100多种不同亚型,其中许多亚型的发病率低于0.1/10万人年。这些罕见亚型使临床医生难以准确诊断所有患者。研究人员收集了874个WSI样本(来自817名患者),涵盖67种非GBM、非PCNSL的CNS肿瘤亚型,以及33个正常脑组织样本(来自33名患者)。PICTURE的认知不确定性估计模块能够识别既不是GBM也不是PCNSL且在训练阶段未见的样本。
研究表明,PICTURE系统通过整合不确定性量化和基础模型集成,显著提升了深度学习模型在计算病理学分析中的泛化能力和可靠性。该方法能有效区分具有临床意义的组织学模拟物,从而实现准确的病理诊断和个性化癌症治疗。研究还揭示了增加训练数据多样性对于增强模型鲁棒性的重要性,以及先进集成策略在确保临床部署可靠性方面的必要性。
该系统在诊断来自世界多个中心收集的病理样本方面表现出卓越性能,为术中冰冻切片评估提供决策支持,并能识别训练队列中未包含的罕见癌症类型。这种综合方法不仅解决了GBM和PCNSL鉴别这一具体临床问题,更为建立可靠、高效的计算机辅助病理诊断系统提供了可推广的框架,最终有助于提高中枢神经系统肿瘤的诊断准确性和患者治疗效果。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号