SpaCross:基于交叉掩码图自编码与自适应空间语义融合的多切片空间转录组学结构解析与批次效应校正新方法

【字体: 时间:2025年10月02日 来源:Communications Biology 5.1

编辑推荐:

  空间转录组学(SRT)面临无监督学习约束、潜在空间缺乏隐式监督以及多切片整合中局部空间连续性与全局语义一致性难以平衡等挑战。研究人员开发了SpaCross框架,通过交叉掩码图自编码器重建基因表达特征,利用自适应混合空间-语义图结构整合多切片数据。该方法在单切片空间域识别中优于13种前沿方法,成功整合小鼠胚胎发育多时间点数据,识别出背根神经节等阶段特异性结构,并在心脏领域重建了与心脏成熟相关的关键转录转变轨迹。

  
多细胞生物的组织功能依赖于细胞间精确的空间协调与调控。传统单细胞测序技术虽能分析细胞表达异质性,却无法捕捉支配组织功能的"空间密码"。空间转录组学(Spatially Resolved Transcriptomics, SRT)技术的突破性发展将基因表达谱与空间坐标耦合,为揭示组织结构的分子蓝图提供了新范式。然而,当前空间域识别方法仍面临三大挑战:无监督学习约束导致嵌入表示缺乏准确性;潜在空间缺乏隐式监督削弱了模型鲁棒性;多切片整合中难以平衡局部空间连续性与全局语义一致性。
为破解这些难题,云南大学的研究团队在《Communications Biology》上发表了题为"SpaCross deciphers spatial structures and corrects batch effects in multi-slice spatially resolved transcriptomics"的研究论文,提出了一个综合性深度学习框架SpaCross。该框架通过创新性地整合交叉掩码图自编码器与自适应空间-语义融合技术,实现了稳健的空间模式识别和跨切片一致性分析。
研究人员运用多项关键技术开展研究:采用迭代最近点(Iterative Closest Point, ICP)算法进行多切片三维空间配准;构建交叉掩码自监督学习机制,通过随机生成互补掩码视图实现特征重建和潜在空间一致性学习;开发自适应混合空间-语义图(Adaptive Hybrid Spatial-Semantic Graph, AHSG)结构,动态整合局部空间邻域和全局语义聚类信息;基于10x Visium、STARmap、osmFISH等多平台空间转录组数据集,使用调整兰德指数(Adjusted Rand Index, ARI)和聚类准确率(Accuracy, ACC)等指标进行系统评估。
SpaCross增强DLPFC中的聚类和层特异性识别
在人背外侧前额叶皮层(DLPFC)数据集上的评估表明,SpaCross在空间域识别方面显著优于13种最先进方法。其平均ARI达到0.557,ACC达到0.667,均值为所有方法中最高。与单纯依赖无监督学习的方法相比,SpaCross产生的空间域具有清晰界限和最小斑点混合。可视化分析显示,SpaCross的潜在嵌入呈现从Domain 1到Domain 7的清晰线性轨迹,与皮质层分层完全一致。空间可变基因(Spatially Variable Genes, SVGs)分析鉴定出30个具有 distinct 空间模式的基因,包括Domain 8中的PLP1、Domain 5中的NEFL和Domain 3中的ENC1等。
SpaCross在不同实验平台上稳健描绘组织结构
在人类乳腺癌(BRCA)数据集上,SpaCross表现出显著性能优势,聚类准确率(ARI=0.65, ACC=0.72)优于次优方法DiffusionST(ARI=0.58)。更重要的是,SpaCross有效解决了现有算法对IDC_2和IDC_5区域的分割偏差,准确描绘了动态肿瘤边缘过渡区。在小鼠初级视觉皮层(MVC)数据集上,SpaCross实现了0.70的ARI,精确区分了胼胝体(Corpus Callosum, CC)、海马体(Hippocampus, HPC)和六个新皮质层(L1-L6),而对比方法如stDCL未能分离HPC和CC区域,GraphST和SpaGCN则表现出严重的细胞混合现象。
**
SpaCross校正连续组织切片中的批次效应
在多切片整合评估中,SpaCross在Donor3切片上表现出卓越性能,中值ARI=0.637,ACC=0.702。其创新的混合邻域图架构通过跨切片表达相似性建模增强空间域连续性,配合潜在空间一致性模块提高切片间鲁棒性。SPIRAL虽然表现出竞争性的聚类精度(ARI=0.637),但其空间域结果存在离散异常点,DIS值高达0.0908。STitch3D采用ICP和PASTE算法进行空间坐标配准,但其中值指标较差(ARI=0.538),且在第4层出现域不连续现象。
SpaCross平衡发育一致性和阶段特异性变异
应用SpaCross到小鼠胚胎Stereo-seq数据集,整合三个发育阶段(E9.5、E10.5和E11.5)数据,鉴定出20个组织区域簇。研究发现心脏(簇20/4)、背根神经节(Dorsal Root Ganglion, DRG, 簇12/2)和大脑(簇10/5)三个高度一致的空间域,证实了SpaCross在跨阶段空间对齐中的鲁棒性。值得注意的是,DRG区域在E9.5时缺失,但在E10.5和E11.5时显著出现,反映了神经嵴细胞迁移和神经节形成等已知生物学事件。
SpaCross实现空间解析数据的跨平台整合
在整合小鼠嗅球(Mouse Olfactory Bulb, MOB)的Stereo-seq和Slide-seqV2数据集时,SpaCross表现出卓越的跨平台整合能力。其空间域边界与DAPI显示的层状结构精确对齐,Stereo-seq(蓝色)和Slide-seqV2(橙色)斑点完全重叠在共享区域,而在平台特定区域保持 distinct。特别值得注意的是,SpaCross实现了对副嗅球(Accessory Olfactory Bulb, AOB)及其颗粒层(AOBgr)的稳健划分,这些结构由于空间分辨率或覆盖范围的限制,在单独使用任一平台时都无法被一致解析。
**
SpaCross泛化至复杂多切片和多组织场景
在MERFISH衍生的小鼠下丘脑视前区数据集上,SpaCross实现了最高平均ARI(0.5854)和ACC(0.643),显著优于其他方法(ARI<0.5)。其多切片混合图架构自适应整合片内空间域约束和片间相似性,有效减轻了跨厚片变异。在成年小鼠全脑(Adult Mouse Whole-brain, AMB)多切片数据集上,SpaCross中值ARI达到0.44,特异性检测到与艾伦小鼠脑参考图谱中海马区精确注册的簇11,同时在AP轴轨迹分析中有效保存了复杂组织切片的生物学异质性。
研究结论表明,SpaCross通过整合交叉掩码重建学习、潜在一致性强制和自适应混合图建模,不仅提高了空间域识别和多切片整合的准确性,还为发育生物学、神经科学、肿瘤学等不同生物学背景下的组织结构研究提供了宝贵见解。该框架的理论和实践意义为未来在复杂发育和解剖背景下的空间分析研究奠定了坚实基础。
方法的开源实现可从https://github.com/wenwenmin/SpaCross获取,所有分析数据集均已公开提供,为空间转录组学领域的进一步方法开发和比较研究提供了重要资源。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号