Nature Methods:“scfind”加持,使你更容易地检索单细胞测序数据

【字体: 时间:2021年03月08日 来源:生物通

编辑推荐:

  一种新的软件工具允许研究人员快速查询单细胞测序产生的数据集。用户可以识别出任何基因组合活跃的细胞类型。在3月1日出版的《Nature Methods》杂志上,开放存取的“scfind”软件能够在一台标准计算机上快速分析包含数百万个细胞的多个数据集。

“scfind”软件能够在一台标准计算机上快速分析包含数百万个细胞的多个数据集。这类数据集的处理时间只有几秒钟,节省了大量时间和计算成本。该工具由威康桑格研究所(Wellcome Sanger Institute)的研究人员开发,可以像搜索引擎一样使用,用户只需输入自由文本以及基因名称。

在过去的10年里,对单个细胞的遗传物质进行排序的技术发展迅速。单细胞RNA测序(scRNAseq)评估哪些基因在单个细胞中是活跃的,可以一次用于数百万个细胞,并产生大量的数据(人类肾脏图谱为2.2GB)。包括人类细胞图谱和疟疾细胞图谱在内的项目正在利用这些技术来揭示和描述生物体或种群中存在的所有细胞类型。数据必须易于访问和查询,以获得最大的价值。

为了实现快速高效的访问,一个名为scfind的新软件工具使用两步策略将数据压缩约100倍。高效的解压使快速查询数据成为可能。scfind由Wellcome Sanger研究所的研究人员开发,它可以在标准计算机上对涉及数百万个细胞的数据集进行大规模分析,而无需特殊硬件。以前需要几天才能返回结果的查询现在需要几秒钟。

这个新工具还可以用于多组学数据的分析,例如通过将单细胞ATAC-seq数据与scRNAseq数据相结合。

Wellcome-Sanger研究所的博士后Jimmy Lee博士是这项研究的主要作者,他说:“多组学方法的进步为了解基因调控网络的格局和动态提供了前所未有的机会。scfind将帮助我们识别调控基因活动的基因组区域——即使这些区域距离它们的靶点很远。”

scfind还可以用来识别与细胞类型相关的新的遗传标记。研究人员表明,与手工管理的数据库或其他可用的计算方法相比,scfind是一种更精确的方法。

对用户更友好的是scfind结合了自然语言处理技术,允许任意查询。

曾任Wellcome Sanger研究所(现供职于哈佛医学院)的Martin Hemberg博士说:“单细胞数据集的分析通常需要基本的编程技能以及遗传学和基因组学方面的专业知识。为了确保大量的单细胞数据集能够被广泛的用户访问,我们开发了一种类似于搜索引擎的工具,允许用户输入任何查询并找到相关的细胞类型。”

Chan-Zuckerberg计划的科学项目官员Jonah Cool博士说:“新的、更快的分析方法对于在单细胞数据(包括人类细胞图谱)中发现有前景的见解至关重要。像scfind这样的用户友好型工具正在加快科学的步伐,提高研究人员利用彼此工作的能力,而Chan-Zuckerberg倡议组织很自豪地支持开发这项技术的团队。”

原文检索:Fast searches of large collections of single-cell data using scfind

(生物通:伍松)


 

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号