新研究全面评估13种单细胞Hi-C分析工具

【字体: 时间:2025年11月11日 来源:news-medical

编辑推荐:

  为了评估现有工具在不同应用场景中的优劣,凯斯西储大学的研究人员近日利用10组单细胞Hi-C数据集对13种嵌入工具进行基准测试。

  

3D基因组结构在远端基因调控中发挥关键作用,而表征不同细胞类型中的结构一直是生物医学研究的重点。染色质构象捕获(3C)技术可鉴定远端染色质相互作用并绘制3D基因组结构。

近年来,多种单细胞Hi-C技术相继问世,包括single-cell Hi-C、sci-Hi-C等。嵌入分析是单细胞Hi-C分析中的关键环节,但也面临着独特的计算挑战:在捕捉状态特异性基因组结构的同时,需克服严重的数据稀疏性。

目前,多种降维技术已被用于单细胞Hi-C数据嵌入分析,但不同分析流程在分辨率、数据表示和预处理步骤上存在显著差异。由于细胞状态变化可能涉及到不同尺度的基因组结构改变,故单一分辨率的嵌入流程可能无法满足所有应用需求。

为了评估现有工具在不同应用场景中的优劣,凯斯西储大学的研究人员近日利用10组单细胞Hi-C数据集对13种嵌入工具进行基准测试。他们将研究成果发表在《Nature Communications》杂志上。

共同通讯作者、凯斯西储大学遗传学与基因组科学系Fulai Jin教授表示:“DNA的3D结构影响着基因之间的相互作用,正如房间的布局影响着人们的活动。了解这种结构有助于弄清楚疾病如何发展以及我们该如何治疗。”

研究团队攻克了一个关键难题:现有的单细胞Hi-C嵌入工具常常产生不一致的结果。Jin教授打了个比方,这就像多名译员无法就外语文本的含义达成一致意见。

研究人员在10个来自小鼠和人类的数据集上测试了13种软件工具,发现不同工具适用于不同类型的数据。他们还发现,改变分析前的数据准备方式可以显著改善结果。

基准测试显示,基于深度学习的嵌入工具Higashi和Va3DE是表现最佳的两种方法,在多个应用中均表现优异。因此,当细胞数量不多(如<1万个细胞)时,他们建议采用深度学习工具以获得最佳结果。

不过,当细胞数量庞大时,研究人员认为采用传统方法可显著提升效率。他们特别推荐SnapATAC2(500 kb分辨率),该工具在所有传统方法中表现最优,并在所有基准测试数据集中展现出可靠性能。

Jin教授指出,这些工具可帮助科学家确定病变细胞中基因的开关状态,解释为什么疗法只对部分患者有效,并追踪细胞在早期发育过程中的变化轨迹。

研究人员还开发出一个软件包,可帮助其他科学家选择特定应用中的最佳分析方法,就像GPS应用程序为用户规划最佳路线。

“研究者无需再猜测哪种工具表现最佳,我们的软件能测试多种方法并推荐最佳工具,” Jin教授表示。

这个名为SCORE的Python软件包通过开源平台GitHub供全球科学家免费使用,地址为:https://github.com/JinLabBioinfo/SCORE。

“这是朝着解读现代测序产生的海量数据并理解人类基因蓝图的运作机制迈出了关键一步,” Jin教授谈道。


相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号