
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于对比学习的统一空间转录组分析框架spCLUE:实现单切片与多切片数据的精准空间域识别
【字体: 大 中 小 】 时间:2025年06月24日 来源:Genome Biology 10.1
编辑推荐:
为解决空间转录组学(ST)数据中单切片和多切片样本的空间域识别难题,研究人员开发了基于多视图图网络和对比学习的统一分析框架spCLUE。该研究整合注意力机制和批次提示模块,在六种不同技术平台的数据集上验证了其优越性能,为组织空间结构的精准解析提供了强大工具。
在生命科学领域,空间转录组学(Spatial Transcriptomics, ST)技术正以前所未有的分辨率揭示组织内基因表达的空间模式。然而,如何从这些海量数据中准确识别具有生物学意义的空间域(spatial domains),特别是跨多个组织切片的整合分析,仍存在三大挑战:现有方法难以平衡空间邻近性与转录相似性的关系;深度学习模型缺乏明确的聚类信号引导;多切片数据中的批次效应严重影响整合效果。
针对这些关键问题,中国地质大学(武汉)数学与物理学院和加州大学河滨分校统计系的Xiang Wang、Wei Vivian Li*和Hongwei Li团队在《Genome Biology》发表了创新性研究成果。他们开发的spCLUE框架通过多视图图网络、双重对比学习模块和创新的批次提示设计,在六种不同技术平台的数据集上实现了单切片和多切片空间域识别的统一分析,其性能显著优于现有16种基准方法。
研究采用的核心技术包括:1) 基于空间距离和基因表达相关性构建双视图邻接图;2) 结合实例对比(instance contrastive)和聚类对比(clustering contrastive)的双重学习策略;3) 注意力机制融合多视图嵌入;4) 针对多切片数据的批次提示嵌入校正。实验数据涵盖人类前额叶皮层(DLPFC)、乳腺癌、小鼠胚胎(MOSTA)等6个数据集,涉及10x Visium、Slide-seqV2等技术平台。
spCLUE改善DLPFC数据集的空间域识别
在包含12个切片的人类前额叶皮层数据中,spCLUE以0.77的调整兰德指数(ARI)最优性能准确识别了7个皮质层结构,其生成的PAGA图清晰呈现了皮层分层拓扑结构。

跨技术平台的稳健性能验证
在乳腺癌(10x Visium)、小鼠视觉皮层(BaristaSeq)等数据集上,spCLUE平均ARI达0.66-0.71,显著优于Seurat、BayesSpace等方法。特别是在小鼠嗅球数据中,其识别的空间域与已知标记基因(S100a5ONL、Slc6a11EPL等)高度吻合。

多切片数据的高效整合
通过批次提示模块,spCLUE在包含12个未对齐切片的DLPFC样本中实现最优整合(ARI=0.71),其生物保守性评分(bio-conservation)和批次校正评分(batch-correction)均领先Harmony、STAligner等方法。

模块贡献度分析
消融实验证实,移除实例对比模块(spCLUE w/o instance)或聚类对比模块(spCLUE w/o cluster)分别使性能下降18%和15%,而批次提示模块在多切片数据中提升整合效果达23%。
该研究通过创新的图对比学习框架,首次实现了空间转录组数据中生物学变异与批次效应的解耦分析。spCLUE的三大突破在于:1) 通过多视图图网络捕捉空间-表达互补特征;2) 双重对比学习同步优化实例表征与聚类结构;3) 批次提示模块实现技术变异早期隔离。这些进展为复杂疾病的微环境解析、发育过程的时空图谱构建提供了方法论基础,其开源实现将促进空间组学领域的标准化分析流程建立。
未来工作可拓展至多组学数据整合,如结合组织学图像的第三视图输入,或处理空间-CITE-seq等多模态数据。正如研究者指出:"spCLUE的模块化架构使其有望成为空间多组学研究的通用分析平台"。这项研究标志着空间转录组学分析从单切片向多样本整合、从单一模态向多维度关联的重要跨越。
生物通微信公众号
知名企业招聘