一种深度学习框架,用于识别全切片组织病理学图像中具有预测价值的癌症区域(DOVER)
《Cancer Letters》:A deep learning framework to iDentify prOgnostically releVant cancEr Regions (DOVER) within whole slide histopathology images
【字体:
大
中
小
】
时间:2025年11月19日
来源:Cancer Letters 10.1
编辑推荐:
预后相关区域定位;深度学习框架;组织微阵列;生存预测模型;免疫细胞分布;病理图像分析;对抗训练;肿瘤异质性;特征表示;多模态验证
### 深度学习在计算病理学中的应用:DOVER框架助力癌症预后分析
近年来,计算病理学领域取得了显著进展,特别是在从全切片图像(WSI)中提取有价值的预后信息方面。这些方法主要依赖于基于深度学习或手工特征表示的疾病形态学模式与临床结果之间的关联。然而,确定肿瘤中最具有预后意义的区域仍然是一个挑战,因为即使在人工标注的肿瘤区域内,形态学异质性也十分显著。换句话说,问题不仅仅是选择合适的特征表示方式来预测癌症结果,而是要明确在这些巨大的图像中哪些区域真正包含预后相关的信号。为此,本文提出了一种深度学习框架DOVER,用于在WSI中识别具有预后意义的癌症区域(PR regions),并展示了其在非小细胞肺癌(NSCLC)和p16+口咽鳞状细胞癌(OPSCC)患者中的应用效果。
### 为什么识别预后相关区域如此重要?
在计算病理学的研究中,研究人员通常关注的是“学习什么”以及“如何学习”。前者涉及如何从图像中提取具有临床意义的特征表示,而后者则涉及如何选择这些特征的来源。例如,手工地提取的特征通常与特定的细胞结构(如细胞核或淋巴细胞)相关,而深度学习方法则依赖于自动学习的特征表示。然而,这些方法在识别图像中哪些区域对预后信息具有重要贡献方面仍显不足。当前的许多模型在训练时仅关注特征的类型,而忽略了特征来源的空间位置。因此,即使在图像中提取了丰富的特征,如果这些特征来源于非预后相关区域,那么模型的预测能力可能会受到严重影响。
### DOVER框架的创新点
DOVER的创新之处在于,它不仅关注特征的类型,还强调特征的来源区域。该框架利用组织微阵列(TMA)斑点中的模式与长期临床结果之间的关联,通过对抗训练将这些模式映射到更大的WSI上,从而定位出具有预后意义的区域。DOVER的核心思想是,即使某些斑点在形态学上是同质的,它们也可能携带不同的预后信息。因此,通过将这些信息转移到WSI中,可以更精准地识别出对患者预后具有关键影响的区域。
### 实验设计与数据集
为了验证DOVER的有效性,研究人员从五个独立的队列中收集了2041名患者的WSI和TMA数据,包括NSCLC和OPSCC。其中,D1队列用于训练和内部验证,D2和D3用于NSCLC的独立测试,D4、D5和D6用于OPSCC的测试。这些数据集经过严格的图像质量控制,确保了数据的可靠性。此外,为了进一步分析DOVER所识别的区域,研究人员还利用定量免疫荧光(QIF)图像,这些图像展示了CD8、CD20、CD4和PanCK等免疫标志物和肿瘤标志物的表达情况。
### DOVER的工作流程
DOVER的工作流程包括以下几个关键步骤:首先,利用预训练的TMA基线生存分类器生成弱监督的PR标签;其次,通过对抗训练的全卷积网络,将这些PR标签映射到WSI上,生成具有预后意义的区域热图;最后,基于这些热图,从高PR区域提取特征,并用于训练下游的生存预测模型。这种策略不仅提高了生存预测的准确性,还增强了模型的可解释性,使研究人员能够明确知道哪些区域对预后具有实际意义。
### 实验结果与分析
在NSCLC和OPSCC的独立测试中,DOVER在多个方面表现出色。首先,基于DOVER所识别的高PR区域进行训练的生存预测模型,其c-index比使用低PR区域或随机采样的模型提高了超过20%。其次,QIF分析显示,DOVER所识别的高PR区域中,免疫细胞(如CD8、CD20和CD4)的分布更加均衡,而低PR区域则主要由肿瘤细胞组成,免疫细胞分布不均。这表明,DOVER能够有效识别出那些对患者预后具有重要影响的区域,而这些区域往往在形态学和分子水平上与低PR区域存在显著差异。
### 与传统方法的比较
为了进一步验证DOVER的优势,研究人员将其与多种传统的图像块选择方法进行了比较,包括基于注意力机制的多实例学习(ABMIL)方法,如CLAM、TransMIL和DSMIL。结果表明,DOVER在多个指标上均优于这些传统方法。例如,在NSCLC的D2和D3数据集上,DOVER的c-index分别比CLAM、TransMIL和DSMIL提高了5.8%至27.4%。此外,DOVER在使用不同特征表示(如手工地提取的特征或基于基础模型的特征)时,均能保持良好的性能,而其他方法则在不同特征表示下表现不稳定。
### DOVER的生物学意义
DOVER不仅提高了生存预测的准确性,还揭示了肿瘤微环境中复杂的免疫细胞与肿瘤细胞的相互作用。通过QIF分析,研究人员发现高PR区域中免疫细胞的分布更加多样化,且与肿瘤细胞形成了更紧密的联系。这种分布模式可能反映了肿瘤对免疫系统的反应,进而影响患者的生存率。因此,DOVER不仅是一个技术工具,它还为理解肿瘤微环境的生物学机制提供了新的视角。
### 未来展望与局限性
尽管DOVER在NSCLC和OPSCC的预后预测中表现出色,但该方法仍存在一定的局限性。首先,所有研究均基于回顾性数据,缺乏前瞻性验证。其次,只有部分队列提供了相应的QIF图像,这限制了模型在不同数据集上的泛化能力。未来的研究可以进一步扩展DOVER的应用范围,使其不仅适用于NSCLC和OPSCC,还可以用于其他类型的癌症和非肿瘤性疾病。此外,结合更先进的空间蛋白质组学技术,可以进一步揭示高PR与低PR区域在分子层面的差异,从而为精准医疗提供更全面的支持。
### 结论
DOVER为计算病理学提供了一种新的方法,使研究人员能够更准确地识别出对患者预后具有重要意义的区域。通过结合对抗训练和弱监督学习,DOVER不仅提高了生存预测的性能,还增强了模型的可解释性。该方法在NSCLC和OPSCC中的应用表明,预后相关区域的识别对于改进个性化治疗和提升患者预后具有重要价值。未来,随着更多数据的积累和新技术的应用,DOVER有望成为计算病理学领域的重要工具,为精准医疗提供更可靠的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号