ProTaxoVis:蛋白质分类学可视化揭示生物通路中蛋白质存在模式的研究

【字体: 时间:2025年05月20日 来源:BMC Bioinformatics 2.9

编辑推荐:

  蛋白质存在信息对生物通路研究至关重要,为实现其可视化分析,研究人员开发 ProTaxoVis 工具。该工具提取数据库查询中的蛋白质存在信息并映射到分类树或热图。结果表明其可展示蛋白质分布模式,助力通路进化等研究,为相关分析提供新视角。

  
在生命科学领域,揭示蛋白质在不同生物体中的分布规律及与生物通路的关联,一直是探索生命奥秘和疾病机制的关键。现有研究虽能通过基因序列推断蛋白质存在,但如何高效整合多物种数据并直观呈现蛋白质分布的进化特征,仍是亟待解决的问题。例如,不同代谢通路中酶的存在与否不仅反映物种的代谢能力,还可能揭示通路的进化轨迹,而传统方法难以在宏观尺度上实现多物种蛋白质存在模式的可视化比较。

为攻克这一难题,挪威北极大学(UiT Arctic University of Norway)的研究人员 Yin-Chen Hsieh、Mathias Bockwoldt 和 Ines Heiland 开展了相关研究,开发出新型生物信息学工具 ProTaxoVis,并将成果发表在《BMC Bioinformatics》。该研究旨在通过整合多物种蛋白质存在数据,构建可扩展的分类学可视化模型,为比较生物通路分析提供直观工具。研究表明,ProTaxoVis 能够有效提取、过滤和整合序列查询结果,并通过分类树和热图展示蛋白质分布模式,为解析蛋白质进化与功能关联提供了新途径。

研究主要采用以下关键技术方法:

  1. 序列查询与数据处理:利用 BLASTp 工具对 NCBI 非冗余(nr)蛋白质数据库进行搜索,获取目标蛋白质的同源序列命中结果,并通过 Biopython 等库解析处理数据。
  2. 分类学映射与可视化:借助 ETE 3 工具包构建分类树,将蛋白质存在信息以饼图形式映射至树节点;同时生成交互式热图,以灰度或二进制形式展示蛋白质在特定物种集合中的存在 - 缺失及显著性。
  3. 质量控制与过滤:通过覆盖图和长度直方图设定 e 值和最小蛋白质长度阈值,排除低质量命中,确保数据准确性。

结果与分析


1. ProTaxoVis 工具架构与工作流程


ProTaxoVis 是基于 Python 的命令行工具,包含 taxovis、taxotree 和 blast2fasta 三个工具及 TaxFinder 模块。其工作流程包括初始化工作区、配置参数、种子序列选择、序列查询、结果过滤、分类树与热图构建。例如,用户需手动填充 proteinlist.txt(蛋白质名称与序列文件映射)、limits.txt(e 值和长度阈值)等配置文件,通过 BLASTp 获取命中结果后,经过滤整合生成可视化输出。分类树拓扑结构基于 NCBI 分类学,节点饼图面积反映命中数量,颜色代表单一或组合蛋白质的存在;热图则通过层次聚类展示物种与蛋白质的关联模式,支持绝对(黑白)和相对(灰度)视图切换。

2. 磷酸核糖转移酶(PRT)家族的应用验证


研究以磷酸核糖转移酶家族(包括 NAMPT、NAPRT、QPRT 等 6 种酶)为案例,分析其在真核生物、细菌和古菌中的分布。BLAST 查询结果显示,不同酶的命中数量差异显著(如 APT 命中约 14,000 条,NAMPT 约 3,600 条),可能与数据库覆盖度或酶的生物学丰度相关。分类树显示,细菌中 NAD 代谢相关酶(NAMPT、NAPRT、QPRT)呈现互斥分布,暗示细菌进化中酶的特异性选择;真核生物中三者常组合存在,可能与 NAD 循环通路的多样化有关;古菌中 QPRT 占主导,可能与种子序列质量或数据库采样不足有关。热图则进一步展示了 PRT 在模型生物中的存在模式,如脊椎动物中 NAMPT 与 NAPRT 分布相似,而细菌和古菌中 UPRT 普遍存在。

3. 工具性能与应用潜力


ProTaxoVis 通过质量控制步骤(如交叉命中矩阵检测)确保数据可靠性,并支持用户自定义过滤参数和可视化样式。其应用不仅限于代谢通路,还可扩展至信号转导等其他生物过程,例如对 mTOR 通路的分析已显示出潜力。工具的开源特性(代码托管于 GitHub)和跨平台兼容性,使其适用于不同研究背景的用户。

结论与意义


ProTaxoVis 通过整合序列查询、分类学映射和交互式可视化,为蛋白质存在模式分析提供了一站式解决方案。其核心价值在于:

  1. 宏观视角解析进化:分类树直观展示蛋白质在生命树中的获得与丢失事件,为理解生物通路的进化提供线索,如细菌中 NAD 代谢酶的互斥分布可能与底物适应性进化相关。
  2. 多维度数据整合:结合热图的精细分析,可在物种集合层面比较多种蛋白质的协同分布,助力功能关联预测,如 PRT 家族在真核生物中的组合模式提示其协同参与核苷酸代谢。
  3. 推动跨学科研究:工具的易用性和可扩展性使其适用于微生物组学、药物靶点筛选等领域,例如通过分析病原体中特定酶的分布,可为抗菌药物设计提供靶点线索。

该研究不仅填补了蛋白质存在可视化领域的工具空白,更通过实际案例验证了其在揭示生物进化规律和通路复杂性中的应用价值,为后续跨物种功能比较和疾病相关通路研究奠定了方法学基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号