Geo-MIL:基于几何多示例学习的弱监督胃癌分割新框架

《npj Digital Medicine》:Geometric multi-instance learning for weakly supervised gastric cancer segmentation

【字体: 时间:2026年01月14日 来源:npj Digital Medicine 15.1

编辑推荐:

  本文针对全切片图像(WSI)中癌细胞区域弱监督分割因缺乏像素级标注而受阻的难题,提出了一种名为几何多示例学习(Geo-MIL)的新型图神经网络框架。该研究创新性地将WSI建模为图结构,并引入拓扑注意力机制,显式建模组织斑块间的空间关系,从而学习识别诊断相关的整体组织结构而非孤立斑块特征。在三个公共胃癌数据集上的实验表明,Geo-MIL在分割准确性和分类性能上均显著优于现有先进方法,为数字病理学中可扩展且准确的定量分析铺平了道路。

  
胃癌是全球癌症相关死亡的主要原因之一,其诊断和分期的金标准依赖于组织活检的病理学评估。病理学家需要仔细检查全切片图像(Whole-Slide Images, WSIs)以识别恶性区域、评估形态学特征并确定肿瘤浸润范围。近年来,深度学习模型在自动化部分工作流程方面展现出巨大潜力,有望提高诊断效率和可重复性。然而,开发高精度胃癌分割模型的一个主要障碍是巨大的数据标注需求。全监督方法(如U-Net及其变体)依赖于具有精确像素级标注(勾勒肿瘤边界)的大型数据集。创建这些详细的掩模异常耗时费力,需要病理学专家投入大量精力,这成为阻碍开发可扩展且鲁棒模型的重要瓶颈。
为了规避这一标注瓶颈,弱监督学习(Weakly Supervised Learning, WSL)获得了广泛关注。其中,多示例学习(Multiple Instance Learning, MIL)是计算病理学中占主导地位的WSL范式。在MIL框架中,一张WSI被视为一个由图像斑块(实例)组成的“包”,模型仅使用单一的幻灯片级别标签(例如“肿瘤”或“正常”)进行训练。基于注意力的MIL模型可以成功识别有判别性的、含有肿瘤的斑块,并在WSI分类任务中取得了先进的结果。
然而,传统的MIL框架存在一个根本性局限:它假设包内的实例是独立同分布的。这种“斑块包”方法忽视了组织病理学中固有的关键空间上下文和组织结构。胃癌的生长模式,如腺体形成、间质浸润和细胞分化,是由细胞和组织间的空间关系定义的,而不仅仅是单个斑块的外观。因此,标准注意力机制生成的定位图通常不完整,并且难以准确分割弥漫性或浸润性肿瘤区域,因为它们未能捕捉到潜在的组织拓扑结构。
在这项发表于《npj Digital Medicine》的研究中,研究人员认为,要实现精确的弱监督分割,必须超越“斑块包”范式。他们提出了一种新颖的几何多示例学习(Geometric Multi-Instance Learning, Geo-MIL)框架,将空间和结构先验明确地纳入学习过程。该方法将WSI建模为一个图,其中斑块是节点,它们的空间邻接关系定义了边。这使得模型能够学习斑块级别的特征,以及表征胃癌的高阶结构模式。
与现有模型不同,Geo-MIL引入了一种可学习的拓扑门控机制,该机制基于局部组织结构自适应地调节消息传递。这种可微设计实现了动态结构推理——允许模型识别诊断相关的拓扑模式,而不是依赖于固定或手工设计的先验。
研究人员开展了系统的实验验证。他们使用了三个公开的胃癌病理学数据集:TCGA-STAD(胃腺癌)、GasHisSDB(良恶性分类)和ACDC-GastricDB(腺癌细分类)。模型首先将WSI分割成斑块并提取特征(使用自监督学习的Vision Transformer, ViT),然后构建k近邻图(k=8)。核心模块是拓扑注意力图神经网络(TopoGNN),它包含L=3层图层,具有隐藏特征维度D=256。模型采用双目标训练策略,结合幻灯片级别分类损失和实例级别伪分割损失,使用AdamW优化器进行端到端训练。
主要技术方法概括
研究利用自监督学习(DINO框架)预训练的ViT-S/16模型提取WSI斑块特征。将WSI构建为图(节点为斑块,边基于空间邻接),提出拓扑注意力图神经网络(TopoGNN)进行消息传递,其中包含新颖的拓扑门控机制以学习组织结构。采用双目标损失函数(幻灯片级别分类损失和基于MIL注意力的伪分割损失)进行端到端训练。实验在TCGA-STAD、GasHisSDB和ACDC-GastricDB三个公共胃癌WSI数据集上进行评估。
2 结果
2.4 定量比较
结果明确证明了Geo-MIL框架的优越性。它在所有三个评估数据集上均取得了最先进的性能。在弱监督分割任务中,Geo-MIL的优势最为显著。在具有挑战性的、多机构的TCGA-STAD数据集上,该方法获得了0.789的Dice分数,这比最强的非图WSS方法(Patch-WI)高出6.4个百分点,比次优的图方法(HistoGraph)高出6.8个百分点。这一趋势在所有数据集上保持一致。虽然针对分割进行了优化,但Geo-MIL并未牺牲分类准确性。事实上,它在所有三个数据集上均取得了最高的AUC(曲线下面积)、准确率和F1分数。
2.5 消融研究
为了严格验证Geo-MIL的架构选择并量化其每个核心组件的贡献,研究人员在TCGA-STAD数据集上进行了一系列消融研究。结果表明,每个组件对于实现最先进性能都至关重要:移除图结构(回归到基于Transformer的MIL基线)导致Dice分数从0.789大幅下降至0.702,证实显式建模组织空间拓扑对于从稀疏的幻灯片级别标签生成准确、密集的分割至关重要。用标准图注意力网络(GAT)层替换TopoGNN层后,Dice分数下降至0.721,表明虽然通用图表示有帮助,但拓扑门控机制(使模型能够学习整个组织结构而非仅聚合相邻特征)是性能提升的关键部分。仅使用MIL分类损失(λ=0)并直接从原始MIL注意力分数导出分割输出时,Dice分数急剧下降至0.708,说明专有的分割头和伪分割损失对于迫使模型学习所有肿瘤区域的全面图谱至关重要。
2.6 定性结果和可视化
定性分析直观展示了Geo-MIL相比将斑块视为无序集的方法为何能生成更优的分割掩模。在一个多灶性肿瘤病例中,Patch-WI和AB-MIL未能识别肿瘤的全部范围,产生不完整且稀疏的热图,而图方法HistoGraph虽然表现更好,但错误地将两个不同的肿瘤巢合并为一个实体。相比之下,Geo-MIL准确地将两个区域 delineate 为分离的、完整的对象。在另一个具有复杂筛状腺体结构的病例中,基线方法难以贴合复杂的边界,而Geo-MIL产生的掩模在空间上连贯且解剖学上精确。生成的细分掩模与病理学家标注的金标准显示出显著的一致性,成功捕获了Case A中复杂不规则的边界和Case B中更呈分叶状的结构。
2.7 性能分布和稳健性分析
对TCGA-STAD测试集上所有幻灯片Dice分数分布的分析显示,标准MIL方法(如TransMIL)分布宽且位置较低,表明性能可变性高。专用的WSS方法Patch-WI中位数性能略有改善,但分布仍然较宽。图方法竞争对手HistoGraph取得了更具竞争力的分布,但仍存在大量性能较差的异常值。相比之下,Geo-MIL的分布显著更高且紧凑得多,高位数分数和窄四分位距表明其性能高度一致可靠,失败案例极少。
2.8 亚型特异性分割性能
按组织学亚型(肠型、弥漫型和混合型腺癌)对性能进行分层分析。Geo-MIL在肠型肿瘤上获得最高的Dice分布,反映了其相对连贯的腺体结构。弥漫型肿瘤的性能变异性更大,这与其浸润性生长模式和边界不清一致。混合型介于两者之间。此分析强调Geo-MIL不仅改善了整体分割,还能适应胃癌的不同形态学变体。
2.10 模型分析和实际考虑
训练和验证曲线显示稳定收敛,无显著过拟合迹象。模型对关键超参数(邻域数k和图层层数L)在合理范围内表现稳健,峰值出现在k=8和L=3。在计算效率方面,Geo-MIL虽然比非图的TransMIL引入适度的计算开销,但仍保持高效,且比更复杂的HistoGraph模型更快,在准确性和计算开销之间提供了有吸引力的平衡。
2.11 跨数据集泛化分析
为了严格评估Geo-MIL的稳健性,进行了跨数据集泛化实验。模型仅在TCGA-STAD训练集上训练,然后直接在未见的GasHisSDB和ACDC-GastricDB测试集上评估,不进行微调。结果表明,虽然所有模型在面临域偏移时性能均下降,但Geo-MIL表现出明显更好的泛化能力。例如,在GasHisSDB上测试时,TransMIL的Dice分数下降超过25%,而Geo-MIL的性能仅下降12%。应用Macenko染色归一化技术后,所有方法的性能均得到改善,但Geo-MIL在归一化后仍保持其优越性能,表明其优势源于其架构设计,而不仅仅是颜色不变性。初步的跨癌症评估(将基于胃癌数据训练的Geo-MIL直接应用于结直肠癌WSIs(TCGA-COAD))获得了0.776的Dice分数,表明其拓扑感知推理能有效捕捉上皮性恶性肿瘤共有的结构规律性。
3 讨论
本研究解决了计算病理学中弱监督分割的关键挑战。研究表明,通过超越传统的“斑块包”范式,并通过新颖的Geo-MIL框架显式建模组织拓扑结构,可以仅从幻灯片级别标签生成高保真度的分割掩模。定量结果显示其性能相比十二种最先进的基线方法有显著飞跃,定性分析证实了模型 delineate 复杂和弥漫性肿瘤模式的能力,这些模式会使其他方法混淆。Geo-MIL的成功很大程度上归功于其拓扑注意力机制。与标准的MIL或通用GNN方法不同,该方法学习识别并优先考虑整个组织结构模式。消融研究证实,这种结构感知推理是关键区别因素,使模型能够区分病理学上显著的结构与孤立的噪声伪影。这代表了向学习组织水平紊乱(这定义了恶性肿瘤)的模型迈出的一步,反映了人类病理学家的诊断过程。
从临床角度来看,Geo-MIL从弱标签生成空间连贯肿瘤图谱的能力为可扩展的数字病理学应用开辟了新可能性。生成的分割掩模可作为手动标注的可靠替代品,用于计算肿瘤-间质比、量化肿瘤负荷或评估浸润前沿不规则性等任务——这些都是肿瘤学中已建立的预后生物标志物。此外,这些拓扑感知表征可以促进肿瘤微环境组织的下游建模,从而支持精准病理学和规模化计算组织学。
研究结论与意义
Geo-MIL框架通过将组织拓扑建模为图并设计新颖的拓扑注意力机制,成功克服了标准MIL方法的关键局限,能够从仅有的幻灯片级别标签中学习识别指示恶性的复杂结构模式。在三个公共数据集上的广泛实验证明,Geo-MIL显著优于多种最先进方法,产生具有卓越准确性和连贯性的分割掩模。这项工作代表了减少计算病理学中标注瓶颈的重要一步,并为开发用于定量癌症诊断的鲁棒、可扩展AI工具铺平了道路。其图结构特性为融合基因组学、转录组学或空间组学特征等异构生物医学模态提供了自然接口,有望实现更全面、生物学上可解释的模型,将组织病理学形态与分子表型联系起来,推动整体、拓扑知情的计算诊断和预后发展。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号