空间转录组学聚类方法的跨技术、器官与生物学重复系统性基准测试揭示组织异质性解析新策略

【字体: 时间:2025年10月11日 来源:iMeta 33.2

编辑推荐:

  本综述对14种空间聚类算法在约600个数据集(涵盖10种技术平台、8种器官类型)进行了系统性性能评估。研究揭示了不同方法在跨技术(如10x Visium、Slide-seq、MERFISH)、跨器官(脑、肝、肺等)及生物学重复场景下的特异性表现,指出数据稀疏性、空间连续性模式和预处理流程对聚类准确性的关键影响,为空间转录组学(SRT)研究提供了方法选择的实践指南和优化策略。

  
研究背景与意义
空间转录组学(Spatially Resolved Transcriptomics, SRT)技术在保留空间位置信息的同时捕获基因表达数据,彻底改变了组织异质性研究的范式。空间聚类作为SRT数据分析的核心步骤,是识别组织结构、解析微环境特征的基础。尽管已有多种空间聚类算法被开发,但缺乏跨技术平台、器官类型和生物学重复的系统性性能评估。本研究首次对14种主流空间聚类方法进行了大规模基准测试,为方法选择提供了实证依据。
数据与方法体系
研究整合了约600个真实与模拟数据集,覆盖10种SRT技术平台(包括ST、10x Visium、Slide-seq、Stereo-seq、Visium HD、seqFISH+、STARmap、MERFISH、CosMx和Xenium)和8种器官类型(脑、乳腺、心脏、肾脏、肝脏、肺等)。所有数据集均采用经过生物学验证的标注作为金标准。评估的14种方法涵盖概率统计模型与神经网络方法,包括BASS、Banksy、BayesSpace、CCST、CellCharter、DeepST、GraphST、PRECAST、SEDR、STAGATE、SpaGCN、SpaceFlow、SpatialMGCN和stLearn。采用6种常用指标(ARI、NMI、FMI、Purity、Homogeneity、Completeness)量化聚类准确性,同时评估运行时间、内存消耗及空间连续性指标(ASW、CHAOS、PAS)。
跨技术平台性能对比
研究发现在不同技术平台上方法性能存在显著差异:
  • 10x Visium脑数据集上STAGATE表现最佳(中位ARI=0.498)
  • ST数据集中BASS(0.461)和BayesSpace(0.415)效果最优
  • Slide-seq数据中STAGATE(0.490)和SpaGCN(0.458)领先
  • seqFISH+数据集中所有方法表现均相对较差(最佳PRECAST仅0.228)
  • CosMx大数据集上Banksy表现突出
高性能方法往往需要更多计算资源,如BASS和CCST在Stereo-seq和Xenium大数据集上运行时间和内存消耗较高。空间分辨率差异也影响聚类任务性质:中分辨率平台(如ST、10x Visium)更适合空间域识别,而高分辨率平台(Stereo-seq、Xenium)更适合细胞类型聚类。
跨器官架构的性能差异
器官特异性空间结构显著影响聚类准确性:
  • 大脑皮层等连续分层结构中,STAGATE、GraphST等基于图的方法表现优异
  • 肠道多层结构(黏膜、黏膜下层、肌层)识别中CCST(0.619)、DeepST(0.521)和CellCharter(0.527)准确
  • 肝脏、肺等结构不规则器官中,stLearn、PRECAST等对连续性假设较弱的方法更具优势
空间连续性指标(PAS、CHAOS、ASW)分析表明,SEDR、SpaceFlow和BASS在连续结构中表现良好,但在低连续性器官中可能产生与金标准不一致的结果。算法运行效率方面,贝叶斯推断方法(BASS、BayesSpace)普遍计算成本较高,整合组织学图像的方法(stLearn、DeepST)需要额外图像特征提取资源。
生物学重复与空间扰动稳健性
通过scCube模拟生物学重复和空间邻域扰动实验发现:
  • 10x Visium重复数据中DeepST、Banksy、SEDR、GraphST和STAGATE稳健性最佳
  • MERFISH数据中BASS、stLearn、SpaGCN和PRECAST表现稳定
  • 相邻聚类合并操作降低多数方法准确性,但DeepST、SEDR、GraphST和STAGATE保持较高NMI
  • 新聚类插入实验中,DeepST、STAGATE和SEDR对空间结构扰动表现出较强韧性
研究表明,对边界变化和邻域扰动敏感的方法往往依赖固定空间图或强平滑假设,而灵活整合空间与转录组信息的方法更具稳健性。
空间模式与数据特征的影响机制
通过SRTsim和scCube控制系统性模拟实验发现:
  • 数据稀疏性是影响性能的最关键因素,高达92.5%稀疏性时PRECAST性能下降显著(ARI从接近1降至0.019)
  • BASS、Banksy和DeepST对高稀疏性稳健(ARI保持>0.9)
  • 斑点数量主要影响计算效率,对准确性影响较小
  • 聚类数量增加导致所有方法性能下降(ARI从1降至0.4-0.8)
  • 聚类形状复杂性中,DeepST、BASS和SEDR在不同形态(线性、环形、浸润式)中表现最稳定
参数化模拟显示,聚类准确性与空间模式清晰度参数λ高度相关(BASS、CCST、CellCharter、SpaceFlow、STAGATE的Pearson r>0.9),而SpaGCN和stLearn在低λ值(模糊边界)场景中保持相对较好性能。
预处理流程的关键作用
研究系统测试了标准化、对数转换、基因选择、标准化和降维步骤的影响,发现:
  • 不同方法对预处理步骤敏感性差异显著
  • DeepST受PCA成分数量影响较大,而GraphST表现稳定
  • BASS和STAGATE使用默认流程即可达到峰值准确性
  • 最优通用流程包括:文库大小标准化、对数转换、Spark-X选择3000个空间可变基因、不进行标准化、使用前20主成分
  • 多切片整合未带来准确性显著提升
实践指南与方法推荐
基于全面评估结果,研究提出技术特异性推荐:
  • 10x Visium数据:STAGATE、DeepST、SEDR(连续结构);PRECAST、stLearn(低连续性器官)
  • 高分辨率数据(Slide-seq):BASS为首选
  • 生物学重复场景:DeepST、Banksy、SEDR、GraphST、STAGATE
  • 空间扰动数据:DeepST、SEDR、STAGATE
研究局限与未来方向
研究存在以下局限:未涵盖所有可用方法;未深入探讨性能差异的因果机制;未评估方法的其他功能(细胞类型反卷积、切片整合、伪时间重建等)。未来方向包括:开发更灵活的空间模型;优化多模态整合策略;建立技术特异性标准流程。
结论
本研究提供了迄今为止最全面的空间聚类方法基准测试,证明了性能表现受技术平台、器官结构、数据特征和方法设计的共同影响。研究为领域提供了实践选择指南,强调了预处理流程优化的重要性,为SRT数据分析的可靠性和一致性建立了框架。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号