STEAM:基于机器学习评估空间转录组聚类性能的创新算法与框架

《Briefings in Bioinformatics》:STEAM: Spatial Transcriptomics Evaluation Algorithm and Metric for clustering performance

【字体: 时间:2025年11月01日 来源:Briefings in Bioinformatics 7.7

编辑推荐:

  本研究针对空间转录组学缺乏金标准验证聚类一致性的难题,开发了STEAM算法框架。通过整合机器学习分类模型与空间邻域分析,该工具可系统评估聚类结果的可靠性,并在多种分辨率数据集上验证其有效性,为空间生物学研究提供重要质量评估工具。

  
随着空间转录组学技术的迅猛发展,科研人员现在能够在保留原始组织结构的条件下探索基因表达的多样性和特异性。然而,一个亟待解决的问题是如何准确识别在基因表达和物理组织结构上都具有空间一致性的区域。由于缺乏金标准标签,聚类结果的一致性和可重复性验证变得异常困难,这凸显了开发计算评估框架来客观评估聚类性能的必要性。
在此背景下,科罗拉多大学医学院的研究团队提出了STEAM(Spatial Transcriptomics Evaluation Algorithm and Metric,空间转录组学评估算法与指标)。这是一个用户友好的计算流程,通过利用机器学习分类和预测方法评估聚类结果的一致性和可靠性,其目标是维持聚类内的空间邻近性和基因表达模式。此外,STEAM还能迭代校正错误分类的细胞,为聚类优化提供可操作的指导。
为了验证STEAM的有效性,研究团队在多种公共数据集上进行了基准测试,这些数据集涵盖了多细胞到单细胞分辨率、正常与病变组织,以及空间转录组学和空间蛋白质组学数据。结果显示,通过Kappa系数、F1分数、准确率、调整兰德指数(Adjusted Rand Index, ARI)、标准化互信息(Normalized Mutual Information, NMI)和异常点百分比(Percentage of Abnormal Spots, PAS)等综合统计评估指标,STEAM表现出卓越的稳健性和普适性。
研究过程中采用了几项关键技术方法。首先,利用nnSVG方法进行空间可变基因(Spatially Variable Genes, SVGs)的识别,以筛选出具有空间相干表达模式的基因,作为生物信息学特征选择策略。其次,核心流程是基于空间邻域分析的训练与测试交叉验证。研究采用分层嵌套交叉验证将数据集分区,并对训练和测试数据分别进行标签感知和标签未知的空间平滑处理(邻域平均),以整合局部空间背景。然后,使用多种机器学习分类模型(包括随机森林-RF、支持向量机-SVM、极限梯度提升-XGBoost和多项式模型)进行模型构建和评估。最后,还开发了STEAMCorrection算法,这是一个基于局部空间共识的迭代校正流程,用于自动改进空间转录组数据中的细胞类型注释准确性。所使用的数据集包括10x Genomics Visium生成的人背外侧前额叶皮层(DLPFC)数据、10x Genomics Xenium小鼠皮层数据、CODEX肠道空间蛋白质组学数据以及BRCA1人类乳腺癌Visium数据集。
STEAM在空间转录组学上实现高精度的真实聚类注释预测
为了评估STEAM的性能,研究团队在具有可用人工注释的10x Visium生成的DLPFC脑样本上,使用STEAM框架实施并基准测试了不同的机器学习模型。通过改变邻域大小(1, 3, 5, 10, 25)进行敏感性分析,发现邻域大小为5时,STEAM_RF、STEAM_XGB、STEAM_SVM和STEAM_MN模型在所有样本上均达到最高的Kappa系数(分别为78.1%, 80%, 82.3%, 79.9%)。在固定邻域大小为5后,进一步比较模型性能,发现STEAM_RF、STEAM_XGB和STEAM_SVM模型比STEAM_MN提供更一致的结果,具有更高的F1分数(0.73, 0.78, 0.78 vs. 0.48)、Kappa系数(0.78, 0.79, 0.8 vs. 0.6)和更稳定的ARI值(0.70, 0.71, 0.71 vs. 0.59)。值得注意的是,具有五个空间信息聚类的四个样本(ID: 151669, 151670, 151671, 151672)表现出相对较高的ARI。评估计算效率发现,除XGBoost外,大多数模型都具有良好的可扩展性。这些结果表明RF和XGB是准确、稳健且高效的,适用于大多数分析。此外,与当前空间转录组分类方法一样,STEAM在准确分类类别间边界(如DLPFC数据集中的第4层)的斑点方面面临挑战。为了解决这个问题,团队实施了STEAMCorrection,一个迭代的、空间信息驱动的程序,通过每次迭代逐步提高准确性,特别适用于分析异质性组织和解析困难的过渡区域。
利用STEAM评估多种空间转录组学分析流程的聚类性能
鉴于STEAM能够跨多个基准测试数据集稳健且可重复地评估聚类准确性,研究团队将其用作评估各种聚类方法性能的有效框架。他们选择了代表不同方法学类别的聚类算法:基于统计建模的BayesSpace和DR.SC,基于图方法的SpaceFlow(三者均考虑空间和转录组信息),以及作为基准方法的Seurat(其聚类分配不考虑空间结构)。所有四种方法均在DLPFC数据集的12个切片上使用STEAM_RF和STEAM_XGB进行了测试。结果显示,BayesSpace和SpaceFlow在Kappa、F1分数、ARI和准确率方面优于DR.SC和Seurat。每个方法在多个切片内的性能表现出一致的结果。总体而言,STEAM的结果与计算模型设计相符,空间感知的聚类工具(BayesSpace和SpaceFlow)优于其他空间无关的方法。因此,STEAM为研究人员决策和空间组学聚类稳健性的模型改进提供了一个有前景的途径。
STEAM在多重复样本上保持高精度
空间转录组数据通常从多个相邻组织切片或多个个体收集,但大多数现有方法由于存在个体内和个体间变异,侧重于一次分析单个样本。研究团队假设将STEAM从单样本聚类评估扩展到多样本训练方法可以利用跨样本共享的聚类信息,从而提高聚类准确性和空间域分类。他们将样本根据其特征和空间轮廓的共享定性特征进行分组(第1组:样本151669-151672,n=4;第2组:样本151673-151676,n=4)。在每个组内,识别所有样本共有的空间聚合基因以标准化分析特征。应用10折交叉验证技术,结合每组每个样本80%的细胞进行训练,20%用于测试。STEAM_RF和STEAM_XGB在所有指标上实现了相似的性能,在所有组中具有可比的Kappa、F1分数、ARI值和准确率。多样本分析的结果表明,STEAM提供了对真实聚类的稳健且可靠的预测,可用于评估多样本空间聚类结果。
STEAM可扩展至单细胞分辨率Xenium数据以恢复空间生态位
接下来,研究团队评估了STEAM使用高分辨率10x Genomics Xenium小鼠皮层数据集评估现有空间注释质量的能力。与Visium不同,Xenium提供单细胞分辨率,能够实现更精确的空间定位和显著更多的分析细胞。将STEAM应用于该数据集能够对注释质量进行更严格和更具信息量的评估。具体而言,他们评估了两个级别的注释——细粒度细胞类型(19类)和更广泛的空间生态位(6类)——与组织底层分子和空间结构的一致性。使用五折交叉验证比较STEAM_RF和STEAM_XGB在分类性能和计算时间方面的表现。STEAM_RF在细胞类型注释评估和生态位注释评估方面 consistently 表现出更快的计算速度。尽管运行时间较慢,STEAM_XGB在分类准确率方面略优于STEAM_RF。对于细胞类型注释和生态位检测,STEAM_XGB在所有指标(包括Kappa、F1分数和ARI)上均获得略高的中位数分数。进一步评估不同细胞数量对模型性能的影响,发现在随机下采样数据集比例(40%, 60%, 80%, 100%)下,Kappa、F1分数、ARI和准确率保持稳定。虽然STEAM_RF和STEAM_XGB在恢复单细胞空间转录组学的细胞类型和空间生态位方面实现了相当的分类性能,但STEAM_RF提供了显著更高的计算效率。此外,研究还检查了稀有类别(定义细胞数少于100个),识别出五个稀有群体。STEAM的嵌套交叉验证产生了稳定的结果,表明STEAM能够评估常见和稀有的细胞群体,为复杂空间数据集中的注释质量提供细致的见解。
STEAM能够利用CODEX空间蛋白质组学数据稳健预测空间信息细胞类型
为了证明STEAM在空间转录组学数据之外的适用性,研究团队将其应用于来自HuBMAP的肠道CODEX平台生成的空间蛋白质组学数据集。基于48个充分表征的蛋白质标记物,这些数据揭示了原始研究注释的15种细胞类型,显示出明显的空白区域和独特的结构。肠道的复杂性(由多种重叠和混合的细胞类型组成,与高度异质性的间质结构空间共定位)为STEAM在更具挑战性和更现实的生物学条件下评估现有空间域注释的准确性和一致性提供了更严格的测试。他们进一步可视化了STEAM_RF错误分类的实例,正如预期的那样,这些实例主要位于相邻细胞类型之间的边界处。在所有样本上进行基准测试,STEAM_RF和STEAM_XGB表现出相当的分类性能。这一应用和评估进一步突出了STEAM在从包含比空间转录组学更少分子标记的空间蛋白质组学训练数据中准确预测细胞类型标签方面的多功能性。
STEAM在临床相关肿瘤组织中实现可靠的空间域预测
为了评估STEAM在不同组织类型和疾病注释粒度间的适用性,研究团队分析了公开可用的10x Genomics Visium BRCA1人类乳腺癌数据集。该乳腺癌肿瘤样本呈现高度异质性和无组织的组织景观,与具有明确分层结构的大脑组织不同。该数据集的生物学复杂性使其成为评估空间域推断的宝贵附加基准。他们使用两个级别的注释评估了STEAM的性能:包含四个临床可解释类别(浸润性、肿瘤、肿瘤周围和健康组织)的粗粒度标签,以及包含19种组织学亚型的细粒度标签。在粗粒度注释下,STEAM_RF取得了良好的性能指标。为了进一步评估STEAM评估稀有细胞类型的能力,他们在BRCA1数据集上应用了更严格的阈值(<50个细胞,约占总数据集的2%),识别出四种极其稀有的肿瘤亚型。STEAM继续检测到有意义且可重复的信号。这些发现证明了STEAM在注释粒度间的稳健性,并支持其应用于复杂、异质性疾病组织。
研究团队提出的STEAM框架,通过利用空间邻近性和基因表达模式,评估空间组学数据中聚类的稳健性并校正错误分类的细胞。其基本前提是,由连贯基因表达和空间邻近性定义的稳健且一致的聚类,当使用细胞子集时,应能够实现标记聚类内未观察细胞的准确预测。通过在多样化空间转录组和蛋白质组数据集上进行基准测试,凸显了STEAM提供准确且可重复见解的能力,同时为研究人员的下游分析提供实用指导。
尽管有其优势,STEAM也存在局限性。一个显著的挑战在于准确分类过渡区域,例如狭窄或模糊的组织层,这些区域的细胞组成和基因表达谱逐渐变化。未来的工作可以侧重于通过集成明确考虑空间梯度和基因表达连续性的加权模型来提高STEAM对这些过渡区域的敏感性,从而在高异质性区域优化预测准确性。
随着空间组学数据生成的快速增长,STEAM有潜力作为一个有效的评估框架和首批用于基准测试结果的工具之一。通过实现聚类准确性和可靠性的评估,期望STEAM在推动空间生物学中稳健且可重复的发现方面发挥实用且有前景的作用。该研究最终得出结论,STEAM提供了一个客观且系统的方法来基准测试聚类性能,其集成校正模型以空间信息化和生物学有意义的方式进一步优化细胞类型注释,最终增强了空间组学数据分析的可靠性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号