编辑推荐:
为解决多样本空间转录组学数据整合分析难题,研究人员开展 Stereopy 框架的研究。结果显示,Stereopy 能有效分析细胞和基因多样性、时空变化及 3D 调控机制。这为研究生物过程提供新视角,助力挖掘多样本空间转录组学数据。
在生命科学的研究领域,细胞就像一个个神秘的小宇宙,它们并非静止不变,而是通过增殖、分化和成熟等动态有序的过程,实现自身功能并构建起复杂的多细胞结构。在这个过程中,细胞与外部刺激和相邻细胞组成的微环境进行着空间交互。然而,理解疾病、发育和体内平衡中细胞过程的调控机制,一直是科学界亟待攻克的难题。这往往需要对包含多个样本的数据集进行综合分析,追踪细胞和基因在不同条件、时间点和空间维度上的特异性和变化。
随着高分辨率空间分辨转录组学(SRT)技术的出现,如 Stereo-seq、Slide-seq 等,能够生成大规模的多样本数据集。但现有的分析框架,如 Squidpy、Giotto 等,大多是为单样本分析设计,在处理多样本数据时存在诸多不足,如数据容器无法高效管理多样本数据、缺乏全面的多样本分析能力等。因此,开发一种高效的多样本分析框架迫在眉睫。
为此,华大基因研究院等机构的研究人员开展了一项关于多样本空间转录组学的研究。他们提出了 Stereopy,这是一个灵活的框架,用于对多样本空间转录组学中的比较和时空模式进行建模和剖析,并具有交互式数据可视化功能。该研究成果发表在《Nature Communications》上,为生命科学研究带来了新的突破。
研究人员在这项研究中用到了几个主要关键技术方法。首先是开发了 MsData(多样本数据)容器,它扩展了 AnnData 格式,方便用户对多样本数据进行灵活分析;其次是 MSS(多样本范围)控制器,用于管理结果存储、追踪分析依赖关系和可视化结果;还开发了多样本分析变压器,支持对多样本数据集进行定制分析。此外,利用了空间转录组技术获取多样本数据,并通过多种算法对数据进行分析。
下面来看具体的研究结果:
- Stereopy 框架概述:Stereopy 由可扩展框架、分析模块和可视化工具组成。其框架通过通用容器、控制器和变压器实现数据管理,提供的分析模块和关键算法适用于比较、时空和 3D 整合分析等场景,还具备 2D 和 3D 交互式可视化功能,有助于研究人员深入理解生物过程。
- Stereopy 开发高效多样本数据分析框架:MsData 容器可灵活访问和分析多样本数据,MSS 控制器管理结果和依赖关系,多样本变压器支持定制分析。Stereopy 通过算法和并行计算加速多样本分析,在处理时间上优于现有工具,且利用 GPU 加速提升了部分功能性能。
- Stereopy 揭示比较分析中的细胞和基因多样性:通过比较受干扰或患病样本与对照样本,Stereopy 在细胞和基因水平识别和分析全球和局部多样性。其细胞社区检测(CCD)算法性能优异,能有效识别细胞社区,还发现了如 Spp1 等重要的条件标记,为理解组织结构和功能提供了依据。
- Stereopy 识别时间序列分析中的时空变化:在研究生物体生长发育的时间序列数据时,Stereopy 采用流形分区方法推断细胞类型轨迹,提出时空基因模式识别(TGPI)方法识别基因表达变化模式。通过对小鼠胚胎数据集的分析,揭示了如 Tead1 等关键转录因子在大脑发育中的作用。
- Stereopy 揭示 3D 分析中的生态位介导调控:Stereopy 的 NicheReg3D 管道通过精确表征 3D 生态位的细胞组成,探索细胞间和细胞内的相互作用。应用于小鼠心脏发育研究时,发现了心室心肌细胞(VCMs)与周围细胞的信号传递关系,以及细胞内的调控网络,为理解心脏发育机制提供了新视角。
研究结论和讨论部分表明,Stereopy 是一个强大的多样本数据分析工具,有效解决了多样本空间组学分析中的诸多关键挑战,包括数据管理、分析模块规划、算法开发和数据可视化等。它不仅能验证如足细胞与 GC 细胞的共现等生物学现象,还能深入挖掘如 Tead1 在大脑发育中的功能等潜在机制。同时,Stereopy 支持多种数据类型和分析功能,为多样本空间组学研究提供了全面的解决方案。然而,研究人员也认识到 Stereopy 仍有改进空间,未来将致力于扩展其分析功能,支持更多模态和多组学数据集,以满足不断发展的科学研究需求,推动生命科学和健康医学领域的进一步发展。