《Advanced Science》:HiST: Histological Images Reconstruct Tumor Spatial Transcriptomics via MultiScale Fusion Deep Learning
编辑推荐:
本研究开发了HiST这一多尺度卷积深度学习框架,通过整合空间转录组(ST)与H&E染色组织学图像,实现了从常规病理切片中高精度预测肿瘤区域和重建空间基因表达谱(GEP)。该模型在五种癌症类型中展现出卓越性能(平均Pearson相关系数0.74),其预测的GEP能有效评估肿瘤异质性、预测患者预后和免疫治疗反应,为精准肿瘤学提供了创新工具。
研究背景与意义
空间转录组学(Spatial Transcriptomics, ST)技术能够整合分子特征与空间背景,为肿瘤微环境研究提供宝贵见解,但其高昂成本限制了临床广泛应用。组织病理学图像(如H&E染色切片)是临床诊断的金标准,但受限于病理医师的主观性和图像复杂性,难以全面评估疾病的分子状态。人工智能技术的发展为从组织学图像预测空间基因表达谱(Gene Expression Profiles, GEP)提供了新思路。
HiST模型框架
HiST(Histological Images reconstruct tumor Spatial Transcriptomics)是一个基于多尺度融合的深度学习框架,包含三个核心模块:
- •
预处理模块:采用预训练的Swin Transformer模型提取组织切片特征,生成保留空间位置信息的特征图
- •
预测模块:基于改进的U-Net架构,引入多尺度注意力门(Multi-Scale Attention Gate)和ConvMixer模块,同时完成肿瘤区域分割和空间GEP重建
- •
应用模块:基于ConvNeXt-V2架构,利用预测的GEP进行预后分析和免疫治疗反应预测
肿瘤区域预测性能
在包含5种癌症类型(乳腺癌BRCA、结直肠癌CRC、肝细胞癌HCC、肾透明细胞癌KIRC、卵巢癌OV)的102个ST样本上,HiST展现出优异的肿瘤区域识别能力。在BRCA中曲线下面积(AUC)达0.96,其他评估指标如交并比(IOU)、Dice相似系数等均显示模型具有高灵敏度和精确度。病理医师验证表明,HiST预测的肿瘤区域与人工标注高度一致。
空间转录组重建性能
与6种现有模型(ST-Net、HisToGene、Hist2ST、THItoGene、IGI-DL、EGNv2)相比,HiST在空间GEP预测方面表现最优,平均Pearson相关系数(Rp)在五种癌症中分别达到:BRCA 0.83±0.04、CRC 0.62±0.04、HCC 0.63±0.06、KIRC 0.68±0.09、OV 0.79±0.07,性能提升约两倍。以结直肠癌中的ACTB基因为例,HiST预测与真实表达的相关系数达0.96±0.03,显著优于其他方法。
计算效率优势
HiST的卷积架构在计算效率方面具有明显优势,训练速度和GPU内存使用均优于基于Transformer和图神经网络(GNN)的模型。特征提取预处理有效压缩了图像维度,同时保持了空间关系,使模型可在消费级计算机上部署。
肿瘤异质性分析
HiST重建的空间GEP能够有效揭示肿瘤异质性。在CRC样本中,基于预测GEP的无监督聚类识别出三个空间亚群,其分布与基于真实ST数据计算的拷贝数变异(CNV)评分高度一致,证明了HiST在捕捉肿瘤空间生物学特征方面的可靠性。
临床应用价值
预后预测:在TCGA五类癌症队列中,基于HiST预测GEP的生存模型显著优于基于Swin Transformer和ResNet50特征的传统方法。例如,在COAD队列中,HiST模型的C-index达0.74,明显高于对照模型。
免疫治疗预测:在131例接受免疫治疗的HCC患者队列中,HiST预测的GEP能准确区分应答者与非应答者,准确率达0.79。功能富集分析显示,预测GEP揭示的免疫相关通路与真实ST数据高度一致,如应答者中富集淋巴细胞介导的免疫激活通路,非应答者中富集TGF-β产生、胆固醇代谢等耐药相关通路。
技术优势与创新
HiST的创新性体现在:1)通过空间坐标重建保持相对空间关系;2)多尺度注意力机制增强全局上下文感知;3)高效的卷积架构降低计算需求;4)首次实现从组织学图像预测免疫治疗反应。模型支持可变尺寸的全切片图像输入,具有良好的临床适用性。
局限性与展望
当前局限包括:对形态学关联不强基因的预测稳定性有待提升;免疫治疗队列样本不平衡;ST平台分辨率和基因检测范围限制。未来随着更高分辨率ST数据集的出现和单细胞转录组参考的整合,HiST有望扩展其预测能力,为精准肿瘤学提供更强大工具。