今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

LSGFA:基于领域的大型原核生物基因组同源基因推断方法

《BMC Bioinformatics》:LSGFA: domain-based infraspecific large-scale prokaryotic genomic orthologous gene inference

【字体: 大 中 小 】 时间:2026年06月10日 来源:BMC Bioinformatics 3.3

编辑推荐:

  摘要背景同源基因推断是进化生物学中的一个关键技术挑战。它通常依赖于序列相似性搜索,并使用图聚类方法来推断同源基因家族。然而,对于大规模基因组数据集而言,全对全序列相似性搜索非常耗时。在这项工作中,我们提出了LSGFA方法,该方法基于蛋白质结构域的相似性检测子图,然后在每个子图内进

  

摘要

背景

同源基因推断是进化生物学中的一个关键技术挑战。它通常依赖于序列相似性搜索,并使用图聚类方法来推断同源基因家族。然而,对于大规模基因组数据集而言,全对全序列相似性搜索非常耗时。在这项工作中,我们提出了LSGFA方法,该方法基于蛋白质结构域的相似性检测子图,然后在每个子图内进行图聚类,这些子图对应于具有相似蛋白质结构域组成的序列。

结果

LSGFA的分析工作流程包括四个步骤:蛋白质结构域注释、基于Pfam结构域的初始聚类、基于SSN的聚类以及泛基因组模式的检测。通过与五种最先进的工具(OrthoFinder、Roary、PanTA、Panaroo和PGAP2)在多个数据集上的对比测试表明,LSGFA在计算效率和生物学准确性之间实现了平衡。与OrthoFinder相比,LSGFA所需时间更短,同时识别出的核心基因更多,其同源群推断结果与OrthoFinder的高度一致。

结论

由于原核生物中具有已知结构域的蛋白质比例较高,LSGFA特别适用于原核生物基因组,在这种情况下,它显著减少了计算时间,同时提供了准确的同源基因推断结果。

背景

同源基因推断是进化生物学中的一个关键技术挑战。它通常依赖于序列相似性搜索,并使用图聚类方法来推断同源基因家族。然而,对于大规模基因组数据集而言,全对全序列相似性搜索非常耗时。在这项工作中,我们提出了LSGFA方法,该方法基于蛋白质结构域的相似性检测子图,然后在每个子图内进行图聚类,这些子图对应于具有相似蛋白质结构域组成的序列。

结果

LSGFA的分析工作流程包括四个步骤:蛋白质结构域注释、基于Pfam结构域的初始聚类、基于SSN的聚类以及泛基因组模式的检测。通过与五种最先进的工具(OrthoFinder、Roary、PanTA、Panaroo和PGAP2)在多个数据集上的对比测试表明,LSGFA在计算效率和生物学准确性之间实现了平衡。与OrthoFinder相比,LSGFA所需时间更短,同时识别出的核心基因更多,其同源群推断结果与OrthoFinder的高度一致。

结论

由于原核生物中具有已知结构域的蛋白质比例较高,LSGFA特别适用于原核生物基因组,在这种情况下,它显著减少了计算时间,同时提供了准确的同源基因推断结果。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:同源基因|全对全搜索|蛋白质结构域|图聚类|计算效率|原核生物基因组

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号