综述:乳腺癌中的计算病理学:通过任务导向的人工智能模型优化分子预测

《npj Breast Cancer》:Computational pathology in breast cancer: optimizing molecular prediction through task-oriented AI models

【字体: 时间:2025年12月17日 来源:npj Breast Cancer 7.6

编辑推荐:

  本综述深入探讨了人工智能(AI)在乳腺癌病理学中的范式转变,主张从追求“大数据”的基础模型转向开发精准、任务导向的优化模型。文章批判性分析了大型模型在临床整合、可解释性和泛化性方面的局限,并重点介绍了为预测激素受体(HR)、HER2、Ki-67、BRCA状态等关键分子特征而设计的小型AI模型的优势。作者强调,通过模型蒸馏、弱监督等策略,结合高质量数据集和多机构验证,有望将可解释、可操作的AI创新真正融入乳腺癌诊断流程,推动精准病理学发展。

  

引言:人工智能在乳腺癌病理学中的机遇与挑战

人工智能(AI)正在迅速改变病理学领域,为提高诊断质量和标准化提供了前所未有的机遇,特别是在乳腺癌这类复杂且影响深远的疾病领域。这一变革的主要驱动力是所谓的“基础模型”,即基于大型数据集(以病理学全幻灯片图像(WSI)为核心数据源)进行训练的自监督AI系统。这些模型的关键特征在于其能够适应多种下游任务,例如幻灯片级别分类、感兴趣区域分析、生存预测和生物标志物发现。数字病理学爱好者和技术公司预测这些模型执行诊断任务的准确性可与人类病理学家相媲美,甚至超越。同时,新型AI工具在直接从WSI预测分子改变方面显示出令人瞩目的结果,包括乳腺癌亚型分型和分子状态预测,这表明其有潜力补充和/或提前传统的生物标志物检测。

从“大数据”狂热到精准病理学的演变

受图像识别各领域(如图像搜索、监控、面部/物体检测、自动驾驶)进步的推动,数字病理学领域的主流观点一直是,用更多数据训练的更大模型将带来更好的性能。这一假设助长了对“大数据”范式的关注以及对日益复杂模型架构的追求,期望仅凭数据规模就能确保临床应用的稳健性和泛化性。值得注意的是,这反映了基因组学的早期阶段,当时全基因组测序(WGS)和“多组学”等综合方法被誉为精准肿瘤学的终极工具。然而,随着时间的推移,该领域转向了更务实、更聚焦的策略,例如靶向测序panel,这些方法被证明更高效且更具临床可操作性。但在数字病理学领域,大数据的吸引力再度兴起,引发了重要疑问:这种方法最终是否会催生类似的调整,转向精简的、目标驱动的解决方案。
尽管许多学术中心和病理学或生物样本库联盟现在产生了大量数据,但这些资源在开发具有临床意义且可部署的AI解决方案方面仍未得到充分利用。主要障碍之一是缺乏高质量的数据整理、协调和注释,这些是必不可少但资源密集的步骤。因此,不加选择地积累数据,尤其是来自数字化回顾性组织档案的数据,常常导致难以使用的数据集,其特点是元数据不一致和质量参差不齐。这些限制不仅可能导致模型过拟合,还可能因标签噪声、域偏移或偏见而表现不佳,最终损害临床效用。因此,计算病理学领域需要逐步转向更智能、任务导向的方法,优先考虑效率和可扩展性。

大型基础模型在乳腺癌中的应用与局限

在乳腺癌中,分子分析对于诊断、预后和治疗至关重要,基础模型通常包含来自异质性队列的数百万张WSI,旨在提高跨肿瘤类型、人群和机构的泛化性和稳健性。基础模型的一个关键优势在于其可通过微调适应多个下游任务和癌症类型,而无需为每个终点进行定制化训练。此外,必须区分纯视觉模型和整合了组织学图像与文本数据的多模态模型。后者,即图像-文本对齐模型,在最近的研究中显示出卓越的泛化能力,在预测临床生物标志物和亚型方面优于纯视觉方法。例如,最近一项工作直接比较了跨多种癌症类型的视觉和多模态基础模型,证明当纳入文本数据时,性能和任务适应性得到持续提升。
然而,WSI质量、染色方案、扫描设备以及肿瘤形态生物学特征的变异性可能损害模型的可靠性。这对于罕见的组织学亚型尤其相关,例如微乳头状或顶浆分泌性癌,这些亚型在大型数据集中代表性不足,但可能具有高度特异性的形态学特征。从深度学习的角度来看,形态学的独特性甚至可能有助于基础模型识别肿瘤,潜在地减少有效学习所需的训练样本数量。尽管如此,针对罕见变体进行专门研究的需求仍然存在,特别是当目标是进行监管级验证时。除了模型性能,临床整合还存在系统性障碍,涉及数字基础设施、数据治理和计算资源。许多病理科,特别是在非学术或资源有限的环境中,仍然使用零散的信息技术(IT)系统和实验室信息系统(LIS),这些系统不适合AI工作流程。这些挑战是所有AI工具共有的,是病理学数字化转型更广泛努力的一部分。应对这些挑战所需的基础设施——安全存储、互操作性和可扩展的GPU基础设施——要求很高。最近的研究强调了这些挑战如何即使在资源充足的中心也会延迟或阻碍AI解决方案的部署。
表1总结了近期应用于乳腺癌WSI的基础模型及其主要临床终点(如激素受体、HER2、Ki-67、分子突变)和报告的性能指标(最常见的是曲线下面积(AUC))。然而,准确性和AUC都有其固有的局限性:准确性对类别不平衡敏感,而AUC可能通过平均阈值和忽略模型校准来掩盖临床相关差异。

面向乳腺癌分子病理学的优化模型

为了应对大规模基础模型的局限性,新一代优化AI模型正蓄势待发。这些模型被有意设计得紧凑、任务特定且与临床对齐,为AI融入乳腺癌诊断提供了一种务实的替代方案。这些模型并非试图捕捉疾病的完整形态谱,而是被训练来执行明确定义的诊断或预测任务,例如HR、HER2或Ki-67状态评估,通常是在早期阶段,治疗决策基于精确的免疫组织化学分层。这种任务特定的范式自计算病理学诞生之初(远在基础模型出现之前)就一直是主导方法。尽管该领域最近拥抱大规模病理学基础模型(PFM)以实现其通用适应性的承诺,但早期经验表明,其复杂性、数据要求和计算成本可能限制其直接的临床适用性。最近关于PFM的研究表明其在多种肿瘤类型(包括罕见癌症和分布外队列)中具有很强的泛化能力(AUC≈0.95),但对于某些罕见变体仍存在性能差距,这强调纯粹的通才解决方案可能无法完全满足临床需求。这些观察结果凸显了任务导向模型的持续相关性,这些模型可以针对特定的诊断或预测终点进行优化,并在实际工作流程中高效部署。
一些模型还被开发用于直接从组织病理学切片推断可操作的基因组改变,例如胚系BRCA突变。Faycal等人介绍了一种卷积神经网络(CNN),该网络在三阴性乳腺癌病例的H&E切片上训练,以预测BRCA突变状态。类似地,Bergstrom等人提出了一种深度学习模型,通过整合组织学和基因组特征来预测同源重组缺陷(HRD),获得的AUC值在0.78到0.87之间。这些模型并非直接识别独特的表型,而是根据训练集中与改变共存的形态学特征来估计HRD的概率。因此,它们有望作为筛查工具或决策辅助手段,以优先进行确认性测序,特别是在资源有限的环境中,但它们不应被视为分子检测的替代品。
紧凑模型的好处既是技术性的,也是临床性的。通过避免大型基础架构的计算负担,优化模型提供了更快的推理时间、更低的硬件要求以及更容易融入实际病理工作流程的可能性。一个例子是Orpheus,一种多模态深度学习模型,训练用于从H&E染色的WSI推断Oncotype DX复发评分。该工具展示了仅凭组织学预测复发风险的能力,不依赖于分子替代标志物,这为在无法获得或成本高昂的分子检测的情况下,基于组织学的决策支持打开了大门。
这些进展超越了生物标志物预测。最近,RlapsRisk BC(一种为评估早期ER阳性/HER2阴性乳腺癌转移复发风险而开发的深度学习模型)证明,仅WSI就能预测5年无转移生存期(MFS),一致性指数(C-index)为0.81,优于传统的临床病理学模型(C-index 0.76, p<0.05)。值得注意的是,将AI衍生的风险与临床特征相结合,提高了患者分层的敏感性和特异性。重要的是,对模型识别出的高影响区域进行专家审查,确认预测是基于可识别的组织学特征,增强了模型的可解释性和生物学合理性。这些例子共同凸显了优化AI模型在直接从标准组织学切片进行分子分类和结果预测方面的临床前景。

模型蒸馏与部署考量

在乳腺癌病理学中,AI的成功采用较少依赖于抽象的性能指标,而更多地取决于其在真实世界诊断环境中提供可操作、可解释和可访问解决方案的能力。即使高性能的基础模型,如果无法融入常规工作流程、向临床医生解释或被技术基础设施有限的机构访问,也常常无法发挥作用。可解释性越来越被认为是AI模型临床采用的前提条件,特别是在模型输出似乎超越人类感知的情况下。传统方法如注意力映射、显著性图、Grad-CAM和概念归因技术可以定位对模型预测影响最强的区域或特征,提供支持人工验证的视觉线索。然而,最近的证据强调了重要的局限性。“可解释性悖论”表明,不同的解释方法可能产生不一致甚至矛盾的输出,并且病理学家在解释和信任这些解释方面差异很大。此外,可解释性方法可能对小扰动敏感,可能突出非因果伪影,并且不一定能阐明为何某种模式具有预测性,这引发了对稳定性和保真度的担忧。
除了可解释性,新兴的“可因果性”概念强调临床医生应能够与AI系统交互——提出“假设”问题、探索反事实、研究输入变化将如何改变预测。这种交互式和人在回路的方
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号