HistoMap:从批量RNA测序重建空间分辨单细胞图谱以解析结肠癌免疫排斥微环境

《International Journal of Molecular Sciences》:HistoMap: Reconstructing Spatially Resolved Single-Cell Profiles from Bulk RNA-Seq to Decipher the Immune-Excluded Microenvironment in Colon Cancer

【字体: 时间:2026年06月11日 来源:International Journal of Molecular Sciences 4.9

编辑推荐:

  批量RNA测序(bulk RNA-seq)在细胞混合物中平均化基因表达,掩盖了理解病理过程所必需的单细胞异质性与空间架构。研究人员开发了HistoMap,一种基于深度学习的单细胞空间反卷积(single-cell spatial deconvolution)框

  
批量RNA测序(bulk RNA-seq)在细胞混合物中平均化基因表达,掩盖了理解病理过程所必需的单细胞异质性与空间架构。研究人员开发了HistoMap,一种基于深度学习的单细胞空间反卷积(single-cell spatial deconvolution)框架。该模型采用两阶段流水线:首先,利用β-变分自编码器(β-VAE, β-variational autoencoder)从批量数据重建高保真单细胞图谱;其次,运用组织学视觉Transformer(H-ViT, Histological Vision Transformer),在转录组参考和H&E染色形态学约束的双重指导下,将这些细胞映射至组织坐标。HistoMap在多种人源组织中展现出优越性能,外部验证皮尔逊相关系数(PCC, Pearson Correlation Coefficient)达0.800。应用于14例结直肠癌病例时,揭示了Macro_SPP1介导的纤维化屏障。SPP1+巨噬细胞在侵袭前沿充当空间枢纽,形成功能性隔离带,从物理上排斥细胞毒性T细胞进入肿瘤核心。HistoMap成功架起了批量RNA-seq与空间单细胞架构之间的桥梁。研究结果为免疫检查点阻断(ICB, immune checkpoint blockade)耐药性提供了分子依据,并将SPP1-成纤维细胞轴确定为治疗致敏的关键靶点。
研究背景与问题:空间多样性与细胞异质性是组织复杂性的基本特征。尽管空间转录组学技术可刻画细胞组成、分子架构及功能特征,但现有方法受实验周期长、成本高昂和可扩展性有限等限制。近二十年来批量RNA测序技术积累了海量临床与研究队列数据,如何从中提取单细胞级别及空间维度的信息具有重要的科学价值。现有计算工具如CIBERSORT仅能推断细胞类型比例,无法重建单细胞图谱或进行空间定位;生成对抗网络(GANs)虽可用于单细胞数据生成,但存在模式坍塌和训练不稳定等固有限制。因此,开发能从批量RNA-seq数据反卷积重建空间分辨单细胞表达谱的框架,对于解析复杂肿瘤微环境具有迫切意义。

研究人员的工作与结论:为解决上述限制,研究人员开发了深度学习框架HistoMap,旨在将批量转录组数据转化为空间分辨的单细胞表达图谱。该成果发表于International Journal of Molecular Sciences。HistoMap的核心流程包括两个阶段:第一阶段利用β-变分自编码器(β-VAE)从批量数据重建高保真单细胞表达谱;第二阶段通过组织学视觉Transformer(H-ViT)编码H&E染色图像的形态学特征,并整合空间转录组学(ST)参考与图像拓扑约束,在基因表达与形态学双重指导下将合成单细胞精准定位至空间坐标。该框架在多样本、跨组织的批量RNA-seq数据上实现了高效的单细胞空间重建,为免疫细胞空间分布、基质细胞互作等研究提供了新方法,并为肿瘤免疫治疗策略的优化提供了理论依据。

关键技术方法:研究人员构建了一个横跨脑、乳腺、肝、肺、肠道、扁桃体、前列腺和皮肤八个器官系统的数据集队列,共纳入558个样本,训练、验证与测试集按8:1:1划分。数据涵盖单细胞RNA测序(scRNA-seq)、空间转录组学(ST)、批量RNA-seq及匹配的H&E染色组织图像,来源包括高质量同行评审文献、基因表达综合数据库(GEO)和癌症基因组图谱(TCGA)。在数据预处理环节,对scRNA-seq数据使用Seurat包进行归一化和质量控制(QC),对ST数据去除空条形码和缺失值后基于Seurat分析,并采用ComBat算法校正批次效应;对H&E图像进行染色归一化和图像配准以消除技术偏差。模型训练方面,β-VAE通过压缩潜在空间提取解耦的生物特征,H-ViT用于形态特征提取;随后通过自编码器降维和随机森林回归进行空间坐标的预测与映射。评估指标采用皮尔逊相关系数(PCC)、斯皮尔曼秩相关系数(SRCC)和均方根误差(RMSE),并通过十折交叉验证评估模型稳定性与泛化能力。

研究结果:
2.1 HistoMap的设计概念
HistoMap采用两阶段计算流水线以弥合批量转录组学在捕获空间异质性方面的固有限面。第一阶段利用β-VAE以scRNA-seq为参考反卷积批量数据,重建高保真单细胞表达谱。第二阶段采用H-ViT编码H&E染色图像的形态学特征,整合空间转录组参考与图像拓扑邻域约束,在基因表达和形态学协同优化下将合成单细胞精确定位至其空间坐标。该方法实现了高分辨率细胞类型定位。

2.2 反卷积步骤的性能评估
通过多组织模拟数据集评估β-VAE反卷积模块的鲁棒性。与GAN和条件GAN(cGAN)的对比显示,HistoMap在基因表达皮尔逊相关性方面显著更优,且均方根误差更低。虽然cGAN单细胞合成能力接近HistoMap,但其训练稳定性和推断鲁棒性较差。高特异性标志基因的一致性验证表明,模型成功捕获了细胞类型特异性分子特征。十折交叉验证显示β-VAE保持一致的稳健性并有效缓解了过拟合。

2.3 空间映射步骤的性能评估
通过与Tangram、scSpace、SPOTlight和Bulk2Space等方法在200对模拟数据集上比较评估空间映射准确性。定量评估显示HistoMap获得最高的PCC(0.800)和最低的RMSE,细胞类型组成和空间分布与真实值也呈高一致性。跨组织基准测试表明HistoMap在八个器官系统表现稳定。十三折交叉验证中,HistoMap预测精度与稳定性均最优。此外,采用非配对scRNA-seq参考的交叉验证证实HistoMap不依赖特定配对样本,对同一器官未见样本具有良好的泛化能力。

2.4 消融研究
为探究组织学与转录组学整合对性能的影响,构建了仅使用基因表达(OnlyGene)和仅使用图像特征(OnlyIma)两个变体。结果显示,仅使用任一单模态的PCC分别为0.658和0.747,均显著低于完整模型。完整模型在低标准差下取得最优均值,稳定性更高。研究推断多模态数据融合通过捕获高维空间架构提升了预测准确性和鲁棒性。值得注意的是,OnlyIma优于OnlyGene,暗示H&E图像提供了更高的空间映射信息密度,在转录组数据缺失时仍可作为可靠替代。

2.5 案例研究:Macro_SPP1介导的免疫排斥微环境空间重建与分析
选择14例结肠癌患者的肿瘤样本进行空间重建。生成的伪单细胞与参考数据集在UMAP降维空间高度重叠,高特异性标志基因表达与参考数据高度相关,证实了空间转录组学重建的生物学准确性。通过与病理学金标准对比,预分许排列对齐显示了细胞群与组织学功能区的高度对应:上皮细胞和肿瘤细胞准确定位于肿瘤区域,肌成纤维细胞严格限制在纤维化间质。
通过空间图谱揭示了一个以显著纤维化反应为特征的复杂肿瘤微环境(TME)。Macro_SPP1细胞在肿瘤-间质界面呈现非随机的周边分布。邻里富集分析显示Macro_SPP1与肌成纤维细胞及其他髓系细胞存在高度特异性的空间共定位。空间玫瑰图分析显示其周边间质组分呈极化方向分布,支持其作为空间枢纽与成纤维细胞协同构建促纤维化微环境、形成绕恶性巢团连续屏障的角色。血管生成尖细胞在这些间质通道中的局部富集也显示了新血管生成与纤维化的空间协同。
免疫拓扑分析显示样本中存在显著的免疫排斥表型。两向T细胞、CD8+ T细胞和B细胞虽大量存在,但被限制在远端间质或免疫细胞聚集体中。定量空间距离分析证实Macro_SPP1在距肿瘤边界约50-100像素区域显著富集,形成物理性隔离带。径向密度分析显示细胞毒性CD8+ T细胞在Macro_SPP1密集区密度急剧下降,表明该屏障功能性地阻碍T细胞进入肿瘤核心。调节性T细胞在外周的共存进一步加剧了免疫抑制。

讨论与研究结论总结:研究人员整合单细胞分辨率和高覆盖率转录组学及空间定位能力,提出了新型单细胞空间反卷积框架HistoMap。该模型结合空间转录组参考与图像拓扑约束,在基因表达和形态学双引导下实现高分辨率细胞类型空间定位,克服了临床样本类型的固有限制。跨多种条件的广泛实验证明了该方法在单细胞空间映射任务中的优越性,外部验证进一步确认了模型的鲁棒性与泛化能力。

讨论中特别强调了侵袭前沿拓扑特征的重建。研究结论系统揭示了Macro_SPP1在结直肠癌侵袭前沿的核心调控作用:通过各向异性高密度聚集与肌成纤维细胞共同构建连续性纤维化屏障。这一空间架构物理性地限制了T细胞浸润,功能性地定义了免疫排斥性肿瘤微环境,成为肿瘤免疫逃逸的关键空间决定因素。

在讨论中,研究人员详细分析了参考图谱与生成输出间的细胞类型差异。肥大细胞在参考中出现而在重建结果中缺失,而肠神经胶质细胞(EGCs)被HistoMap独特解析。这种差异反映了β-VAE优化策略的体现:在模拟低丰度细胞时有限化稀疏信号,也可能被过滤;但整合图像拓扑约束与全局转录组信息后,模型能恢复脆弱或代表性不足的群体,有助于提升空间肿瘤微环境解析度。

HistoMap与传统非空间反卷积算法(如CIBERSORT)的本质区别在于:传统方法严格量化单一批量样本的细胞类型丰度,而HistoMap整合多模态输入,将单细胞转录谱投射到独立组织学参考矩阵上,重建属于概率性空间实现而非单一精确事实记录。但通过器官水平架构与形态学约束捕获泛化空间先验,HistoMap可有效地将批量信号转化为高度可信的组织学情境。

最后,论文的研究结论指出:HistoMap将辅助临床医生准确量化细胞间相互作用并预测免疫治疗疗效,为解读复杂生物学过程和推进精准医学临床转化提供新视角与工具。疾病代码已完全开源,未来研究将精炼特征提取模块、提高复合结构特征捕获效率,继续增强模型预测力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号