Visium HD数据解析指南:高效分析与第三方工具精选

【字体: 时间:2025年02月17日 来源:10x Genomics

编辑推荐:

  了解如何使用Space Ranger和Loupe Browser着手开展Visium HD数据分析,以及第三方分析工具的使用建议,这些工具可实现单细胞数据与Visium HD数据的整合、细胞分割等功能。

Visium HD是一款空间生物学发现工具,可从FFPE、新鲜冷冻和固定冷冻的人类和小鼠组织中生成单细胞尺度的全转录组数据。它利用基于NGS的空间转录组学来绘制各个细胞类型的分子表达谱,同时保留组织结构中复杂的空间网络。Visium HD目前免费提供Space Ranger和Loupe Browser等软件工具,它们将组织学图像与高分辨率的空间RNA测序数据结合在一切,从这一独特的数据模态中挖掘出更多信息。这些工具与基于R和Python的第三方开发工具的轻松整合有望带来更大的发现潜力,后者形成的生态系统正在不断扩大,可实现细胞分割、细胞类型解卷积和空间邻域分析等功能。

在最近举办的网络研讨会上,我们介绍了Space Ranger流程和一些第三方工具。作为后续,我们希望将计算生物学团队的专业知识浓缩成Q&A问答,带您了解Visium HD数据分析以及使用第三方工具的一些小技巧。点击此处,即可观看研讨会录播视频)

欢迎阅读下文,回顾我们与10x Genomics计算生物学家Stephen Williams博士与Joey Arthur博士的对话,他们协助开发了Visium HD软件解决方案。了解如何使用Space Ranger和Loupe Browser着手开展Visium HD数据分析,以及第三方分析工具的使用建议,这些工具可实现单细胞数据与Visium HD数据的整合、细胞分割等功能。

【如何着手开展Visium HD数据分析】

(本次采访的对象是10x Genomics的计算生物学家Stephen Williams博士。为了清晰起见,并考虑到篇幅限制,访谈内容有所删减。)

1. 您能描述一下分析Visium HD数据的推荐路径吗?如何在实验结束后从测序步骤跳转到浏览HD数据?

Stephen:在获得测序数据后,您要做的第一件事是通过最新版本的Space Ranger运行这些数据(1)。它将完成条形码校正、UMI检测、将所有转录本映射到图像上的相关区域,并生成您在使用第三方工具时需要用到的所有输出文件。

[我们最近举办的网络研讨会简单演示了如何通过Space Ranger运行Visium HD实验的输出文件。]

它还会生成一份Loupe文件,这是探索数据的良好起点(2)。对于Loupe文件(特别是Visium HD数据),很酷的一点是原始图像就在文件中。它具有超高的分辨率,甚至与显微镜的分辨率一样高。您可以放大图像,并确保您的比对在非常小的尺度下是正确的。您可以查看所有感兴趣的基因,并进行第一轮甚至第二轮分析,比如重新聚类。或者说,举个例子,看看癌症样本中肿瘤组织和正常组织的边界在哪里。

从这一步开始,Seurat、Scanpy或Squidpy都提供了很好的支持 (3,4,5),它们可以进行一些质控,比如说您想去除线粒体含量比较高的bins,或者说您想设置某种UMI阈值,或使用不同的聚类参数。

这就是您在处理数据时可选的第一条路径,也是我一般会做的事情。

2. 用户应如何学习怎样开展这些具体步骤?他们可以从哪里学习如何按照您介绍的步骤进行分析?

Stephen:10x Genomics的支持网站上有您需要的每一份文件,比如如何运行Space Ranger的详细说明,或者我们支持哪些图像格式,您应该使用哪种测序类型(短读长 vs 长读长),以及测序配置。或者,如果您确实不想按照我们建议的去做,您可以学习如何在命令行中输入指令。

Space Ranger的安装过程非常简单,安装说明介绍了该怎么做。一切都已经预先编译好。您只需下载Space Ranger,然后解压到您的计算机或计算系统上,就可以轻松上手了。

至于如何使用第三方工具进行二次分析,也许是更高级的过滤或不同的聚类,它们也有非常好的教程。您访问第三方工具的网站就可以看到这些教程,实际上我们与这些团队密切合作,以确保这些教程能够满足我们用户的最高需求。

3. 用户在分析Visium HD数据和分辨率较低的空间转录组数据集时,预计会有哪些不同之处?例如,当客户从v1或v2版本的Visium空间基因表达分析转换到Visium HD时,应作何准备?

Stephen:我认为他们的第一感受是数据规模非常惊人,数据非常精细。我们获得了在Visium v2和Visium HD上分析的连续切片图像。在v2上,您可以看到漂亮的结构,也可以看到组织中哪些区域的基因表达模式不同。但是在HD上,就像是病理学家对组织进行了注释,因为尺度非常精细,甚至达到8 µm bin尺度。这是人们首先会注意到的。

接下来,他们可能会注意到大量的数据。我该如何处理这些数据?我认为在电脑上学习使用Loupe应该不成问题,它已针对8 µm尺度进行了优化。至于第三方工具,我们已协助他们了解数据,他们也调整了资源,能够处理如此大量的基因数据。

4. 如果要您给用户布置一项家庭作业来熟悉Visium HD数据,您会给他们发送哪些资源?您希望他们在Visium HD数据资源中尝试什么?

Stephen:这要看情况。如果他们是生物信息学家,我会建议他们去看看Seurat和Scanpy提供的教程,它们提供了预加载的数据集。真的很容易使用。您可以一步一步地完成所有操作。

如果是不懂R或Python的实验室工作人员,我会建议他们直接使用Loupe文件,通常为8 µm。您已经熟悉您正在探究的生物学。您也了解您的组织。输入您最喜欢基因的名称,看看它位于何处。也许您可以和实验室里的人或了解组织结构的病理学家坐下来讨论。你们可以从中获得很多信息,而这些人都是各自领域的专家。在图像背景下了解基因表达谱是他们能贡献的最好的东西之一。

我们的网站上有来自不同组织和物种的大量数据集,有小鼠的,也有人类的,供还没有做过Visium HD实验的人参考(6)。我认为,只要去看看公开数据集,看看网络摘要,下载一份Loupe文件或矩阵和空间目录,然后将其加载到Loupe或您喜欢的分析工具中,您就会很容易相信这项技术有多么了不起。亲自去体验一下吧,因为这项技术的可视化效果令人难以置信。

[准备开始了吗?欢迎浏览Visium HD分析的分步教程:利用Visium HD和Loupe Browser绘制组织微环境。(7)]

5. 对于Visium HD分析,Loupe Browser有没有什么很酷的功能值得一提?

Stephen:我非常喜欢的一个功能是,Loupe可以通过各个簇之间的小提琴图比较差异基因表达。这样您能够很好地了解感兴趣的基因是如何分布的。

image004.png

人类乳腺癌FFPE组织切片的Visium HD数据。Loupe Browser中的可视化结果通过叠加在组织上的热图和小提琴图显示了IGKC基因在不同簇之间的差异表达。

此外,当您对组织有所了解时,您也许会认为某个区域聚类不足,比如肿瘤区域,您可以选择该区域并重新聚类。也许您会得到更精细的信息。这种区域特异性的分析开箱即用,而且速度很快。在没有Loupe的情况下,如果您想尝试同样的重新聚类分析,实际上需要一些计算机编程技能,而且可能需要一段时间。这体现了Loupe的了不起。

image005.png

截图显示了Loupe Browser中同一份Visium HD数据集(人类乳腺FFPE组织)的重新聚类流程。图片1。

image006.png

截图显示了Loupe Browser中同一份Visium HD数据集(人类乳腺FFPE组织)的重新聚类流程。图片2。

image007.png

截图显示了Loupe Browser中同一份Visium HD数据集(人类乳腺FFPE组织)的重新聚类流程。图片3。

6. 如果您能向用户或潜在客户澄清与Visium HD数据或分析过程有关的一些东西,您想告诉他们什么?

Stephen:我想告诉他们的第一件事是,数据分析也许有点可怕,但绝非不可能。老实说,Visium HD分析流程对大多数人来说都很容易接受。您不一定要成为程序员或生物信息学家,也能查看结果并获得有意义的信息。

我想告诉大家的另一件事是,尽管我们的分辨率非常高,但并不是单细胞分析。请记住,当您在bin水平上查看基因表达谱时,大部分的bins是某种类型的细胞混合物。它不是一个纯的群体,但比v2更纯。目前,我们还没有在Visium HD上进行细胞分割。尽管如此,还是有一些资源可以进行细胞分割,更有可能是细胞核分割,从而更接近真实的单细胞在空间中的行为(8)。

【高阶Visium HD分析技术和第三方工具】

(本次采访的对象是10x Genomics的计算生物学家Joey Arthur博士。为了清晰起见,并考虑到篇幅限制,访谈内容有所删减。)

1. 您会向客户推荐哪些第三方工具用于Visium HD数据分析,这些工具有什么作用?

Joey:目前有几种不同类别的工具。至少有一个广泛的空间分析平台,这个名为Squidpy的平台建立在基于Python的Scanpy生态系统上。您可以把它想象成一个可扩展的工具包,由许许多多个小型工具和算法组成。它从一开始就是为空间分析而开发的,有很多不错的功能。例如,它特别适合处理成像数据。有了Visium HD,您就获得了这些可以并排或叠放的组织图像,将数据放在图像之上。

单细胞领域的许多人都使用基于R语言的Seurat开展分析。Seurat也支持Visium HD及其他空间分析,不过根据我的经验,用Python处理成像数据会容易一些。

除此之外,还有许多不同的工具可用于特定类型的空间分析。其中一大类是整合单细胞和空间数据的工具。您经常会听到这些被称为细胞类型解卷积的工具。我推荐两个工具用于Visium HD分析:Robust Cell Type Deconvolution(RCTD,在spacexr包中实现)(9)和Cell2Location(10)。Visium HD分析的分辨率非常高:单个正方形的尺寸非常小(2 µm x 2 µm),比一般细胞小得多。不过,正方形和细胞之间并不是一一对应的,比如说这个正方形就是这个细胞等等。因此,人们使用解卷积工具,根据已知的细胞类型来更好地解释数据。这些工具之所以有用,还因为现在有越来越多的单细胞图谱数据。人们收集大量的单细胞数据集,并标注细胞类型。能够将这些知识应用于新的空间数据集,确实很有价值。

[您可以在我们的分析指南中了解这些解卷积工具以及其他第三方工具。(11)]

另一大类工具将是细胞分割。这就是我们在网络研讨会上介绍过的Bin2Cell流程的用武之地 (12)。我觉得这个工具真的很棒。

还有一个名为Voyager的R包,其中一些工具可以用于空间统计分析(13)。许多统计方法或数据分析方法都是针对地理空间数据开发的。在空间转录组学革命之前,过去那么多年的大部分空间数据都来自天文或地理观测,人们想出了许多不同的方法来分析这些数据。这个Voyager包从这些工作中汲取灵感,并将其应用于空间多组学。他们目前正在努力为Visium HD提供支持。

我还想说的是,有许多方法可以找到空间可变基因,也就是说这些基因存在有趣的空间模式,而不仅仅是随机分布。Squidpy和Seurat以及许多独立开发的软件包中都有一些相关工具。

2. 这些第三方工具如何补充Loupe Browser的功能?如何将它们结合起来使用?

Joey:Loupe让您能够交互式探索基因表达数据,并查看不同基因或基因组合。您可以快速滚动图像,放大或缩小图像等等。它可以执行最基本的分析步骤,比如将bins聚类成组,运行差异表达来寻找标志物基因。您还可以利用“重新分析”工具筛选出特定bins或深入研究数据子集。

除此之外,您暂时还需要使用第三方工具。因此,更详细的空间统计分析需要交给下游工具。我们暂时不支持细胞分割。将单细胞和空间数据聚合在一起,查看各个细胞类型分布在哪些空间,这些也需要第三方工具来完成。

就我而言,Loupe是查看原始数据和初步了解情况的最佳方法,因为R和Python包的交互性不够好。

3. 哪些第三方功能让您感到最兴奋,您认为它们将如何影响客户对HD数据的探索?

Joey:对我来说,最令人兴奋的地方其实还没有被这些工具覆盖。我对比较多个样本并观察它们有何不同的工具感到兴奋。随着这些技术更多地被采用,我们将看到疾病(或不同疾病亚型)患者和健康对照的样本组成的大型数据集。我们需要一些工具来表征健康和病变样本有何不同之处,比如询问细胞的空间定位在这些不同群体中发生了怎样的变化?这些工具还没有完全成熟。但我预计理想版本的分析将会在未来一两年内出现。

还有一种分析我也觉得很有趣,在Seurat和Squidpy中可以实现,那就是空间邻域分析(有时也称为生态位分析)。这超出了我们通常用于单细胞分析的聚类和差异表达流程,而且只能通过空间数据完成。在某些组织背景下,聚类结果可能难以解释,但邻域分析能提供与已知形态相匹配的空间区域,让结果更容易解释。在多个样本上开展邻域分析,然后观察不同样本的邻域有何不同,我认为这是一个很有趣的方向。

效果可能与单细胞数据相似,我们可以看到细胞状态的差异。在这种邻域分析中,单个细胞在不同状况下可能很相似,但它们在空间上以不同的方式混合在一起。这种独特的组成产生了不同的空间生态位。因此,您很快就能发现肿瘤中的免疫热点或异质性。我认为这是了解肿瘤的不同部位是否具有不同微环境的好办法。

4. 关于Visium HD的数据或分析过程,您还有其他的想与客户分享吗?

Joey:另一件让我非常兴奋的事是将成像信息更多地纳入数据分析。Visium HD的一个强大功能在于,它允许您拍摄同一张切片的H&E或荧光图像。我们做了大量工作,以确保人们尽可能准确地将成像数据叠加到基因表达数据上。有了Visium HD技术和CytAssist仪器的支持,基因表达数据和Space Ranger生成的图像之间就能实现真正的精准比对。

H&E图像的信息量相当大,病理学家可利用它们对健康状况下结论。因此,将图像与基因表达数据相结合,肯定能让您更深入地了解生物学。即使在最基本的层面上,您也需要H&E图像才能进行细胞分割。如果没有,您可以尝试在连续切片上进行分割,但效果不会太好。

我想很多人都在研究这个。我希望有某种基于深度学习或人工智能的系统,机器学习方法,一次将图像与基因表达数据结合起来。我认为这真的令人兴奋。同样,单细胞分析根本无法做到这一点,因为没有图像。因此,这是空间研究的一个新领域。

欢迎扫码联系我们询价或了解更多技术信息

image008.png

参考资源:

1. Space Ranger: https://www.10xgenomics.com/support/software/space-ranger/latest

2. Loupe Browser: https://www.10xgenomics.com/support/software/loupe-browser/latest

3. Seurat: https://satijalab.org/seurat/

4. Scanpy: https://scanpy.readthedocs.io/en/stable/tutorials/spatial/index.html

5. Squidpy: https://squidpy.readthedocs.io/en/stable/

6. https://www.10xgenomics.com/datasets?query=&page=1&configure%5BhitsPerPage%5D=50&configure%5BmaxValuesPerFacet%5D=1000&refinementList%5Bproduct.name%5D%5B0%5D=HD%20Spatial%20Gene%20Expression

7. https://www.10xgenomics.com/support/software/loupe-browser/latest/tutorials/assay-analysis/lb-hd-spatial-gene-expression

8. https://www.10xgenomics.com/analysis-guides/segmentation-visium-hd

9. https://www.nature.com/articles/s41587-021-00830-w

10. https://www.nature.com/articles/s41587-021-01139-4

11. https://www.10xgenomics.com/analysis-guides/integrating-single-cell-and-visium-spatial-gene-expression-data#community-developed-tools-and-algorithms

12. https://academic.oup.com/bioinformatics/article/40/9/btae546/7754061?login=false

13. https://pachterlab.github.io/voyager/


订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号