自监督学习揭示间皮瘤组织形态学图谱:基于3446张全切片图像的生物学洞察与临床预测新突破

【字体: 时间:2025年10月09日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对间皮瘤诊断中存在的高度形态学复杂性和预后预测难题,利用自监督学习技术(HPL)对3446张H&E染色全切片图像进行深度分析,构建了包含47个组织形态表型簇(HPCs)的定量图谱。研究实现了88%的亚型分类AUC和0.65的生存预测C-index,并通过多中心病理专家验证和分子机制关联分析,揭示了HPCs与肿瘤微环境、增殖标记(Ki67)及mRNA翻译通路(eIF4A1/mTOR)的显著相关性,为间皮瘤的精准诊断和靶向治疗提供了新方向。

  
间皮瘤是一种与石棉暴露高度相关的致命性癌症,其诊断和治疗面临巨大挑战。由于肿瘤具有显著的形态学异质性,即使经验丰富的病理学家也难以通过传统的H&E染色切片准确区分恶性与反应性病变,更难以预测患者的临床结局。目前的AI辅助诊断方法多依赖于有监督或弱监督学习,需要大量人工标注且难以捕捉肿瘤微环境的复杂性。因此,亟需一种能够无标注、自动化地解析间皮瘤形态学特征并关联临床与分子表型的新方法。
在此背景下,由Farzaneh Seyedshahi和Kai Rakovic等来自英国格拉斯哥大学、CRUK苏格兰研究所、莱斯特大学医院等多个机构的研究人员开展了一项大规模研究。他们利用自监督学习框架Histomorphological Phenotype Learning(HPL),对来自485例手术切除样本的3446张全切片图像(WSI)进行分析,构建了间皮瘤的首个定量组织形态学图谱,相关成果已于2025年10月发表在《Nature Communications》。
研究主要依托莱斯特归档胸部肿瘤研究队列-间皮瘤(LATTICe-M)这一大型临床样本库,包含512例患者资料,其中H&E切片经扫描后提取约323万张图像块(tiles),通过Barlow Twins自监督算法提取特征,再经Leiden聚类识别出47个具有可重复性的组织形态表型簇(HPCs)。每个HPC均经由三位亚专业病理学家进行盲法注释,评估内容包括细胞形态、炎症程度、坏死、纤维化等指标。随后,研究利用HPC组成特征进行生存分析(Cox比例风险模型)和亚型分类(逻辑回归),并在TCGA队列和St. George’s Hospital TMA数据集上进行外部验证。
在技术方法上,本研究采用自监督学习(HPL pipeline)从全切片图像中提取形态特征,通过聚类算法识别表型簇(HPCs),并利用这些特征进行生存分析和亚型分类;使用多实例学习(MIL)在组织微阵列(TMA)数据上进行验证;通过免疫组化(IHC)和转录组(RNA-seq)数据关联HPCs的分子基础;应用HoVer-Net模型进行细胞类型分割及炎症评估。
Mapping the histomorphological phenotype landscape
研究成功识别出47个HPCs,这些簇在超过20%的病例中重复出现。罕见HPCs(<20% prevalence)多对应正常组织或特殊反应性改变,而普遍存在的HPCs(>80%)则包括广泛存在的恶性形态或非肿瘤组分(如血管、胶原)。病理学家注释显示,炎症和坏死评估一致性较高(Fleiss’ Kappa 0.2–0.6),而上皮与梭形细胞结构分类存在一定主观差异。
HPCs predict mesothelioma subtypes
通过逻辑回归模型,研究基于HPC频率成功区分上皮样和非上皮样(肉瘤样/双相型)亚型,模型在LATTICe-M上达到88%的AUC,在TCGA队列中为80%。其中,HPC15、16、22(富含紊乱梭形细胞)被一致认定为非上皮样亚型的标志,而部分上皮样HPCs(如HPC6、7)在双相型病例中也显著出现,提示其可能与胸壁侵袭相关。
HPCs as predictors of patient survival
HPC组成在多数据集(LATTICe-M和TCGA)中均显著预测患者生存,C-index达0.65–0.67。加入临床变量(年龄、分期、亚型)仅轻微提升性能。Cox模型识别出HPC10(上皮样巢状结构)和HPC27(密集淋巴细胞)为保护性因子,而HPC15(肉瘤样梭形细胞)和HPC22(过渡型间皮瘤)则与不良预后显著相关。Kaplan-Meier分析显示模型能有效区分高风险与低风险组(p<0.001),且在TCGA纯上皮样病例中优于传统组织学分级(p=0.025 vs. p=0.282)。
Subtype-specific HPC analysis and immunohistochemical marker correlations
在亚组分析中,上皮样病例内HPC22(过渡型形态)强烈预示不良结局,提示其可能代表向上皮-间质转化(EMT)的早期过渡;而在肉瘤样/双相型病例中,HPC23(温和梭形细胞与胶原)与预后差相关,HPC27(淋巴细胞浸润)则关联较好结局。IHC结果显示,高风险HPCs(如肉瘤样或低分化上皮样簇)显著富集增殖标记(Ki67)和翻译起始因子(eIF4A1),且与氧化磷酸化下调相关,支持其代谢重编程特征。
Molecular underpinnings of HPCs
通过整合TCGA转录组数据,研究发现肉瘤样HPCs显著关联细胞增殖、缺氧和EMT相关通路(如KEGG、MSigDB hallmark),而上皮样HPCs则更多表达正常组织相关信号。淋巴细胞富集簇(HPC27)显示与T细胞、B细胞和树突细胞高度相关,提示免疫微环境在预后中的积极作用。
Validation on tiny tissue fragments
研究进一步在St. George’s Hospital TMA数据集(小组织片段)上验证模型泛化能力。通过多实例学习(HPL-MIL)方法,模型在未经过额外训练的情况下仍保持较高分类性能(AUC、精度、敏感性等均优于现有方法如CLAM、MesoGraph),证明其适用于活检小样本的临床诊断场景。
本研究通过自监督学习成功构建了间皮瘤的组织形态学图谱,首次系统性地揭示了其形态表型与临床结局、分子机制之间的定量关系。不仅实现了高精度的亚型分类和生存预测,还发现了过渡型形态等此前难以人工识别的高危表型,为间皮瘤的早期诊断和预后分层提供了新工具。此外,研究证实HPCs与增殖、免疫微环境、代谢通路等关键生物学过程显著相关,为未来靶向治疗(如免疫疗法或翻译抑制剂)提供了理论依据。该方法克服了传统AI模型依赖标注和数据一致性的局限,展现出强大泛化能力,尤其适用于活检小样本的分析,具有重要的临床转化潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号