知识引导的病理学基础模型自适应有效提升跨域泛化能力与人口统计学公平性
《Nature Communications》:Knowledge-guided adaptation of pathology foundation models effectively improves cross-domain generalization and demographic fairness
【字体:
大
中
小
】
时间:2025年12月13日
来源:Nature Communications 15.7
编辑推荐:
本研究针对病理学基础模型存在的站点特异性偏倚和人口统计学偏差问题,提出了FLEX框架。该框架通过视觉与文本知识引导的信息瓶颈,有效解耦了稳健的病理特征与混杂因素。研究利用三大队列超过9900张切片验证,表明FLEX在16项临床任务中显著提升了模型在未见外部队列上的零样本泛化性能,并有效缩小了不同人口群体间的性能差异,为开发更可靠、公平的病理AI工具提供了可行方案。
在人工智能赋能医疗的时代,计算病理学正以前所未有的速度发展。传统的病理诊断依赖于病理学家在显微镜下观察组织切片,这个过程既耗时又容易受到主观因素的影响。近年来,基于全幻灯片图像(Whole-Slide Image, WSI)的人工智能(AI)模型,特别是那些经过大规模自监督学习(Self-Supervised Learning, SSL)预训练的病理学基础模型(Foundation Models),展现出了巨大的潜力。这些模型能够从海量的病理图像中学习可迁移的特征表示,然后通过多示例学习(Multiple-Instance Learning, MIL)等弱监督学习范式,应用于癌症诊断、分子生物标志物预测等多种临床任务,准确率甚至媲美人类专家。
然而,这些强大的模型在从实验室走向真实世界临床应用的路上,遇到了两个“拦路虎”。第一个是泛化能力问题。病理切片在制作过程中,会经历组织处理、染色、扫描等多个步骤,不同医院或研究机构(通常称为“站点”)在这些步骤中使用的设备、试剂和操作流程存在差异,导致最终的数字图像带有独特的“站点特异性签名”(Site-Specific Signatures)。AI模型很聪明,但有时也会“偷懒”,它们可能会学会利用这些与疾病本质无关的、站点相关的表面特征(即“捷径学习”,Shortcut Learning)来做出判断。这导致模型在训练数据所在的站点(域内,In-Domain, IND)表现优异,但一旦应用到来自新站点、新设备的新数据(域外,Out-Of-Distribution, OOD)时,性能就会急剧下降,这无疑给临床部署带来了巨大的风险和不确定性。
第二个挑战是公平性问题。用于训练这些基础模型的大规模数据集,例如著名的癌症基因组图谱(The Cancer Genome Atlas, TCGA),其数据来源存在人口统计学上的不平衡,例如某些种族或祖先群体的数据量远少于其他群体。这种数据偏差会被模型学习并放大,导致模型对 underrepresented(代表性不足)人群的诊断性能显著较差,加剧了医疗健康领域已有的不平等现象。传统的解决方案,如染色标准化(Stain Normalization),主要试图在图像颜色层面进行对齐,但事实证明,它难以消除由组织处理、扫描仪伪影等引起的更复杂的站点特异性偏差,对于深层次的公平性问题更是收效甚微。
那么,有没有一种方法能够“拨开迷雾”,引导模型聚焦于疾病本身的关键生物学特征,同时摒弃那些具有混淆性的站点和人口统计学信息呢?由香港大学、南方医科大学等多机构研究人员合作完成并发表于《Nature Communications》的这项研究,给出了一个名为FLEX(Feature-Level Enhancement for Cross-domain generalization)的创新性解决方案。该研究旨在解决病理学基础模型在跨站点泛化和人口公平性方面的核心挑战。
为了开展研究,作者们利用了三个大型队列数据:公共的TCGA队列、临床蛋白质组肿瘤分析联盟(Clinical Proteomic Tumor Analysis Consortium, CPTAC)队列以及南方医院(Nanfang Hospital, NFH)的内部队列,总计超过9900张WSI,涵盖了非小细胞肺癌(NSCLC)、乳腺癌(BRCA)、胃腺癌(STAD)和结直肠癌(CRC)这四种主要癌症类型下的16项临床任务,包括形态学分类(如区分肺癌的腺癌和鳞癌)、分子生物标志物预测(如乳腺癌的HER2状态)和基因突变预测(如EGFR突变)。研究采用了站点保留的蒙特卡洛交叉验证(Site-Preserved Monte Carlo Cross-Validation, SP-MCCV)策略来严格评估域内外性能,并进行了零样本(Zero-Shot)外部验证。核心技术方法上,FLEX框架的核心是引入一个由视觉和文本先验知识引导的信息瓶颈(Information Bottleneck)。视觉概念通过筛选具有代表性的图像块(Patch)并利用多模态大语言模型(如GPT-4o)和病理专家验证来生成;文本概念则通过设计任务相关和任务无关的文本提示(Text Prompts),并引入可学习的上下文(Learnable Contexts),再经由病理视觉-语言模型(Vision-Language Models, VLMs,如CONCH、PathGen-CLIP、QuiltNet)的文本编码器生成。FLEX利用这些概念,通过对比学习(InfoNCE Loss)和变分信息瓶颈(Variational Information Bottleneck)机制,在特征层面进行增强,过滤掉站点特异性签名和任务无关信息,提升特征的可判别性和鲁棒性。增强后的特征再输入到多种MIL架构(如ABMIL、CLAM-SB等)中进行幻灯片级别的预测。
FLEX改善跨域泛化能力并促进病理学基础模型的准确临床使用
研究人员首先通过UMAP可视化证实了病理学基础模型(如CONCH)提取的特征中存在明显的按站点聚集现象,而按诊断类别分离的效果较差。在TCGA队列的严格评估下,基线模型在域外(OOD)测试数据上的AUROC性能相比域内(IND)数据出现显著下降。而FLEX的应用显著提升了模型在IND和OOD设置下的泛化能力,平均OOD AUROC在形态学分类、分子生物标志物预测和基因突变预测任务中分别提升了6.45%、7.21%和4.94%,有效缩小了IND-OOD性能差距。例如,在STAD-LAUREN任务中,FLEX将OOD AUROC提升了15.13%,并将IND-OOD差距从20.59%缩小到8.64%。对CPTAC和NFH外部队列的零样本评估进一步证明,FLEX能一致且显著地提升模型在全新临床环境中的性能。注意力图谱可视化定性分析显示,FLEX能引导模型更聚焦于任务相关的关键病理模式(如IDC中不规则的腺管结构),而非分散于噪声区域。
研究通过公平性差距(AUROC gap ratio)、真阳性率(True Positive Rate, TPR)差异和按种族分组的AUROC分布等多个指标评估公平性。结果表明,相较于基线模型和染色标准化方法,FLEX能显著减小不同自我报告种族(Self-Reported Race)和遗传祖先(Genetic Ancestry)群体之间的性能差异。FLEX的结果点更紧密地聚集在更低的差距值附近,TPR差异的分布更窄且更集中于零差异线附近,TPR差异的均方根误差(RMSE)值也更低。这表明FLEX能够更公平地应用其诊断能力,减轻了模型对特定人口群体的偏见。
研究将FLEX与三种先进的病理视觉-语言模型(CONCH、PathGen-CLIP、QuiltNet)集成。结果显示,FLEX能一致且显著地提升所有三种基础VLM在OOD泛化设置下的性能。UMAP可视化证实,FLEX处理后的特征分布更均匀,站点特异性聚类消失(局部逆辛普森指数LISI得分显著提高),同时任务相关类别(如EBV阳性/阴性)的分离度增强(轮廓系数Silhouette Score提高)。这表明FLEX减轻站点特异性偏差并增强任务相关生物特征可判别性的双重益处适用于不同的基础模型。
FLEX在不同训练数据规模和不同MIL模型下均有效
通过改变训练数据量的实验表明,FLEX在所有测试的数据规模下均能一致且显著地改善OOD性能。此外,FLEX与五种先进的MIL架构(ABMIL、CLAM-SB、ACMIL、DTFD-MIL、ILRA-MIL)集成时,也都能提升OOD性能,并显著缩小IND与OOD测试之间的性能差距,证明了其与下游MIL模型的灵活性和兼容性。
综上所述,这项研究系统地揭示并验证了病理学基础模型中站点特异性签名和人口统计学偏差的负面影响,并创新性地提出了FLEX这一知识引导的特征增强框架。FLEX通过利用视觉和文本先验知识引导信息瓶颈,有效地从病理图像特征中解耦出稳健的、与任务相关的生物学模式,同时抑制了导致泛化能力差和公平性问题的混杂因素。大量实验证明,FLEX不仅能显著提升模型在未见站点和队列上的零样本泛化能力,还能有效促进模型在不同人口群体间的公平性。更重要的是,FLEX展现出与多种主流病理视觉-语言模型和多示例学习架构的良好兼容性,以及在不同数据规模下的稳定性。这项工作为开发更具泛化性、更公平可靠的临床级计算病理学工具提供了坚实的技术基础和重要的方法论启示,朝着负责任地部署病理AI迈出了关键一步。研究的成功也提示,在未来工作中,可探索将FLEX的理念扩展至仅视觉的基础模型以及预后预测等更复杂的任务,并进一步与病理视觉大语言模型结合,提升模型的可解释性和临床影响力。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号