HERGAST:解析超大空间转录组数据,点亮肿瘤研究新曙光

【字体: 时间:2025年04月29日 来源:Nature Communications 14.7

编辑推荐:

  为解决超大超高分辨率空间转录组学(ST)数据分析难题,研究人员开展 HERGAST 系统研究。结果显示 HERGAST 在模拟和真实数据中均表现优异,能精准识别空间结构、放大基因信号,有助于深入理解肿瘤微环境,推动癌症研究进展。

  空间转录组学(ST)技术就像一把神奇的钥匙,开启了人们深入了解组织内基因表达奥秘的大门,让科学家们能够洞察细胞的异质性和组织的复杂架构。近年来,ST 技术不断升级,从普通平台迈向高清时代,如 Visium HD1、Spatial Molecular Imager(SMI)2 和 Xenium3 等。这些新技术虽然带来了更丰富的数据,但也如同 “甜蜜的负担”,引发了一系列棘手的问题。数据规模呈指数级增长,变得极为庞大,同时数据的稀疏性也显著增加。这使得在分析数据时,准确描绘空间组织结构、识别细胞类型以及检测特定空间的基因表达变得困难重重。
现有的计算方法在应对这些挑战时显得力不从心。例如,BayesSpace4 的优化过程极为耗时,如同老牛拉车;SpatialPCA5 在处理大规模数据时,因存储成对距离内核的问题而无法使用;一些深度学习方法,像 SpaGCN6、SEDR7 等,虽然利用图神经网络进行表示学习,但由于 GPU 内存的限制,面对海量数据时也只能 “望洋兴叹”。此外,简单的技术如 PCA,只关注基因表达相似性,无法充分利用空间信息,导致对 ST 数据的综合利用不足。而且,高分辨率和大规模的数据还会稀释生物信号,在 Xenium 数据中,高表达基因的信号会掩盖低表达基因的重要信息,如何增强或去噪这些生物信号成为当务之急。

在这样的背景下,上海交通大学的研究人员挺身而出,开展了一项意义重大的研究。他们提出了 HERGAST(High-resolution Enhanced Relational Graph Attention Network for ST)系统,旨在攻克超大超高分辨率 ST 数据分析的难题。这项研究成果发表在《Nature Communications》上,为该领域带来了新的希望和突破。

研究人员为开展此项研究,运用了几个主要关键的技术方法。首先是构建关系图,通过考虑不同斑点空间位置的欧氏距离建立空间邻域关系,同时依据基因表达谱的相似性构建表达相似关系。其次,采用 “Divide-Iterate-Conquer”(DIC)框架,将超大尺度的 ST 数据分割成多个小的可处理的斑块进行迭代训练,最后基于训练好的模型在整个切片上进行推理。此外,利用异质图网络和交叉注意力机制,有效整合局部和全局空间关系,避免过度平滑问题。在实验中,使用了多种模拟和真实的 ST 数据集进行分析验证。

下面来看看具体的研究结果:

  • HERGAST 模型概述:HERGAST 基于 DIC 框架,将其与异质图网络和注意力机制相结合。在 DIC 框架中,先把空间切片分割成小块进行迭代训练,再对整个切片进行推理,确保能处理不同规模的数据集。在每个小块内,异质图网络将空间邻近性和基因表达相似性相结合,有效解决潜在的过度平滑问题。交叉注意力机制则动态学习不同关系的注意力权重,实现局部和全局空间关系的自适应融合。训练后,模型能生成低维嵌入,用于解析复杂的空间结构,同时解码器还能重建表达谱,增强关键空间模式和生物信号。
  • HERGAST 在模拟实验中表现卓越:研究人员生成不同规模的 ST 数据集评估方法的可扩展性。结果显示,引入 DIC 策略前,许多基于深度学习的图神经网络模型因 GPU 内存限制,无法分析超过 80,000 个斑点的 ST 切片;引入后,虽然可扩展性增强,但部分方法仍受 CPU 内存限制。HERGAST 在内存消耗和计算效率上表现出色,消耗更少的 CPU 内存,运行时间也更短。在模拟研究中,HERGAST 在所有设置下均优于其他方法,平均调整兰德指数(ARI)等指标提高超过 10%,并且在处理大规模数据时表现出强大的稳健性。此外,通过实验证明异质图网络能有效解决潜在的过度平滑问题,进一步凸显了 HERGAST 的优势。
  • HERGAST 在真实数据中精准识别空间区域:在对 NanoString CosMx SMI 生成的肺癌单细胞空间转录组数据集分析中,HERGAST 在调整兰德指数(ARI)和 Fowlkes-Mallows 指数(FMI)上优于其他方法,尽管在归一化互信息(NMI)和同质性分数(HS)上略逊一筹,但整体性能更优,且在不同分辨率参数下都表现稳健。
  • HERGAST 助力结直肠癌肿瘤微环境精细绘图:结直肠癌(CRC)的肿瘤微环境复杂,对疾病进展和治疗效果影响重大。利用 HERGAST 分析结直肠癌的 Visium HD 数据,发现它能更清晰地区分肿瘤基质区域和肿瘤区域,还识别出肿瘤区域内具有独特基因表达谱的区域,以及围绕钙化区域的 SPP1+巨噬细胞,而其他方法则无法准确识别这些细胞。这一成果对于理解结直肠癌的免疫景观和开发免疫疗法具有重要意义。
  • HERGAST 高灵敏度和特异性增强关键分子特征:高分辨率的 Xenium 数据虽有优势,但存在高强度信号掩盖低强度信号的问题。HERGAST 能有效识别和放大具有空间特征基因的信号。通过模拟实验和对真实的 Xenium 数据(如人正常结直肠组织和乳腺癌组织)分析,结果表明 HERGAST 能在噪声数据中恢复原始空间模式,准确识别相关区域,且不会产生虚假空间模式,还揭示了乳腺癌关键基因的独特空间分布模式。

研究结论和讨论部分表明,HERGAST 是一种针对超大超高分辨率 ST 数据空间聚类和信号放大的高效方法。DIC 策略有效解决了空间分析中的可扩展性问题,异质图网络和交叉注意力机制的结合使 HERGAST 能精准捕捉局部和全局空间关系,避免过度平滑。在模拟和真实数据应用中,HERGAST 均展现出强大的性能,在空间聚类、识别肿瘤微环境特征以及增强关键基因表达信号等方面表现优异。这一研究成果为深入研究复杂生物系统提供了有力工具,推动了生命科学和健康医学领域在肿瘤研究等方面的发展,让科学家们能够更深入地探索疾病机制,为开发更有效的治疗策略奠定了坚实基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号