基于变分空间高斯过程的跨模态多切片空间转录组三维功能景观重建

《Advanced Science》:Reconstructing Coherent Functional Landscape From Multi-Modal Multi-Slice Spatial Transcriptomics by a Variational Spatial Gaussian Process

【字体: 时间:2026年01月13日 来源:Advanced Science 14.1

编辑推荐:

  本文提出stVGP(variational spatial Gaussian process)框架,通过整合多模态多切片空间转录组(ST)数据,实现了三维组织结构的连续重建。该框架结合空间高斯过程与空间分层变换器,可同时完成切片对齐、空间域识别、批次效应校正和虚拟切片生成,在多种组织系统中均优于现有方法,为复杂组织的三维空间建模提供了统一解决方案。

  
1 引言
空间转录组学(ST)技术能够在保留组织原位空间背景的同时进行高通量基因表达谱分析。虽然ST技术显著增进了我们对组织结构的理解,但大多数分析方法仍局限于二维切片,限制了对完整三维空间背景的洞察。构建来自连续ST切片的三维图谱仍然是一个主要的计算挑战,需要解决形态变异、RNA捕获技术不一致性以及切片间组织变形等复杂问题。
生物组织被组织成功能不同的空间域,这些域必须在不同切片间保持一致识别。因此,三维空间建模需要三个基础任务:准确的空间切片对齐、生物学意义空间域的检测以及切片间批次效应的校正。现有方法如PASTE、PASTE2、STitch3D等在切片对齐或域检测方面各有局限,多数缺乏同时处理多任务的能力。
2 结果
2.1 stVGP框架概述
stVGP是一个变分空间高斯过程框架,旨在整合多模态多切片空间转录组数据,实现连贯的三维组织重建。该框架同时建模空间对齐、域识别、批次效应校正和跨切片基因表达预测。输入为一系列二维ST切片,每个切片包含基因表达矩阵、组织学图像和空间坐标。
stVGP包含三个核心组件:跨切片空间域检测和批次校正、组织切片的空间对齐,以及通过虚拟切片生成预测未测量区域的基因表达。该框架首先使用变分空间高斯过程自编码器生成组织的空间表示,该模块能够准确识别空间域同时校正切片特异性批次效应。接着,stVGP通过空间变换器进行非刚性对齐,并通过注意力机制与刚性对齐融合,将所有切片注册到统一的三维坐标系中。最后,为解决ST数据的不连续性和稀疏性,stVGP采用变分空间高斯过程解码器预测未采样空间位置的基因表达并生成虚拟组织切片。
2.2 准确重建人前额叶皮层的空间域并预测基因表达
在人类背外侧前额叶皮层(DLPFC)空间转录组数据集上的评估表明,stVGP能够准确将所有四个切片注册到共享的三维空间中,包括形态学差异明显的切片对151674–151675。在大多数切片对中,stVGP consistently实现了最高的对齐分数和最低的对齐距离。
在空间域检测方面,stVGP在切片151673上达到了最高的调整兰德指数(ARI = 0.60),准确再现了已知的皮质分层。低维嵌入可视化显示,stVGP在保留结构边界的同时校正了切片间差异,而未出现过度校正。stVGP的一个核心优势是能够通过虚拟切片生成预测未采样区域的基因表达。通过在切片151674和151675之间构建一个虚拟切片,发现预测的切片保持了空间连续性并准确插值了组织结构。使用髓鞘少突胶质细胞糖蛋白(MOBP)作为标志基因进行验证,预测与真实表达值在所有切片上均显示出强相关性。
2.3 解码成年小鼠全脑功能架构
将stVGP应用于包含35个冠状切片的成年小鼠大脑空间转录组数据集,这是一个复杂的任务,需要精确对齐数十个切片,同时减轻批次效应,描绘解剖一致的三维空间域,并高保真地重建连续的组织结构。
stVGP在34个相邻切片对中表现出持续的高性能,其对齐输出产生了更规则、解剖一致的排列。stVGP成功识别了跨切片的功能不同脑区,包括等皮质(簇6)、纹状体(簇10)和嗅觉区域(簇11)。利用stVGP对齐的切片和识别的域,生成了成年小鼠大脑的综合三维体积重建。所得模型忠实地再现了主要区域的形态和空间连续性。通过掩码策略评估stVGP的生成性能,从这些虚拟切片恢复的域结构与原始注释密切匹配。
2.4 解析人心脏发育的连贯域
为展示stVGP在发育生物学中的实用性,将其应用于发育中人类心脏的空间转录组数据集,重点关注受孕后6.5周(PCW)的九个冠状切片,这一时期以快速结构多样化为特征。
stVGP consistently优于其他方法,实现了最高的对齐分数。视觉检查证实stVGP产生了最解剖一致的结果。stVGP准确解析了这些空间域,捕捉到大体解剖布局和切片间的细微内部异质性。低维UMAP投影显示stVGP有效校正了批次效应并保留了生物变异。对齐切片和解析空间域后,stVGP成功定位了关键组织区室至解剖正确位置。这些区域显示出与已知标志基因一致的空间基因表达模式,证实了生物保真度。通过掩码策略评估stVGP在重建未采样组织区域基因表达方面的预测能力,结果显示预测与真实基因表达之间存在高相关性。
2.5 推断小鼠嗅球跨个体轨迹
将stVGP应用于小鼠嗅球(MOB)空间转录组数据集,该数据集包含三个具有高度相似形态和组织的连续冠状切片。stVGP有效对齐了所有三个MOB切片,性能优于其他先进方法。基于原始研究注释了MOB组织层,并以个体10切片为例,从内到外识别了五层。stVGP准确识别了所有五层域,推断的域显示出清晰的空间分层,反映了已知的MOB解剖结构。低维UMAP嵌入显示组织域清晰分离,且跨切片批次效应得到正确校正。
2.6 通过跨模态生成准确预测人乳腺癌基因表达
为评估stVGP的跨模态预测能力,将其应用于人类乳腺癌空间转录组数据集,该数据集包含四个具有配对H&E染色组织学图像和基因表达矩阵的空间切片。尽管切片3和切片4存在显著旋转差异,stVGP仍准确对齐了所有切片,重建了跨切片一致的组织轮廓。空间域检测方面,stVGP的聚类结果在形态上与H&E图像中的特征一致。使用组织学特征,stVGP准确预测了它们的空间表达,与真实值达到高相关系数。
3 讨论
理解基因表达在复杂组织中的空间组织需要计算方法能够有效整合来自多个空间转录组切片的信息,同时保留生物结构和形态连续性。stVGP的一个关键创新在于使用空间约束的变分高斯过程来建模跨组织切片的潜在表示。与主要依赖图卷积网络(GCN)或自注意力机制捕捉空间依赖性的先前方法不同,stVGP将物理空间邻近性直接纳入高斯过程核中。
实现准确的跨切片对齐是重建无缝三维空间景观的基石。在stVGP框架内,通过混合对齐策略解决这一挑战,该策略融合了刚性几何变换和非刚性变形建模。刚性对齐基于高特异性基因的空间分布捕获全局结构对应关系,而空间变换器网络(STN)处理由于切片伪影或组织扭曲引起的局部变形。
stVGP的另一个关键方面是其对切片间批次效应的显式建模和去除。传统方法通常假设一个共享的潜在空间,而未完全解决由技术或实验不一致性引入的变异。stVGP将批次特异性先验纳入变分自编码器和对齐过程,从而将技术变异与真实生物信号解耦。
通过整合变分推断、高斯过程和深度对齐机制,stVGP为从高维多模态ST数据重建空间连续转录组结构提供了一个全面的解决方案。跨多种组织类型的评估表明,stVGP在空间对齐、域检测和基因表达预测方面达到了先进性能,同时支持连续三维建模的虚拟切片生成。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号