Vanalyzer:一个开源工具,用于自动化统计分析以及蛋白质数据库中钒酸盐结合位点的持续更新

《Journal of Molecular Graphics and Modelling》:Vanalyzer: an open-source tool for automated statistical analysis and continuous updating of vanadate-binding sites in the Protein Data Bank

【字体: 时间:2025年12月03日 来源:Journal of Molecular Graphics and Modelling 3

编辑推荐:

  本研究开发了Vanalyzer,一个基于Python的开源工具,用于自动分析蛋白质数据银行(PDB)中钒氧阴离子结合位点的结构特征,包括配位几何、氨基酸分布及酶类分层,支持用户界面过滤和实时数据更新,促进钒结合机制研究。

  
Alexander Trachtenberg | Barak Akabayov
本-古里安内盖夫大学化学系与数据科学研究中心,贝尔谢巴,8410501,以色列

摘要

蛋白质数据库(PDB)中蛋白质结构数量的快速增长为我们提供了从具有共同特征的蛋白质中获取生物学见解的机会。利用这一“大数据”资源,我们开发了一个名为“Vanalyzer”的自动化开源Python脚本,用于对PDB中的钒酸盐结合位点进行统计分析。Vanalyzer通过比较不同蛋白质的结合界面和几何结构来评估含有钒基氧阴离子的蛋白质的结构特性。此外,它还允许对特定酶类进行重点分析,从而便于它们之间的直接比较。这一新开发的工具将有助于理解蛋白质结合位点中对钒酸盐的识别,并将成为分析PDB中现有和新增钒酸盐结构的宝贵且最新的资源。

引言

钒是一种过渡金属,在自然界中存在于多种地质和生物系统中,通常与有机物相关联[1]。尽管对这些系统(包括酶系统)进行了数十年的研究,但由于钒酸盐存在的多种环境,了解钒酸盐(VO43?)如何与蛋白质活性位点结合仍然具有挑战性[1,2]。目前,由于蛋白质数据库(PDB)的快速增长,出现了对含有钒基氧阴离子的蛋白质结构进行比较分析的新机会[3]。然而,手动分类PDB条目中的钒酸盐配位几何结构仍然效率低下且容易出错。为了解决这个问题,我们开发了Vanalyzer,这是一个基于Python的化学信息学工具,用于从含有VO43-的PDB文件中自动提取、分类和可视化结构特征。在之前对35个结构的手动研究[3]的基础上,Vanalyzer扩展了对所有已知的含钒酸盐结合蛋白质(目前数量为58个)的钒酸盐配位几何结构的分类,不仅实现了几何分类,还进行了氨基酸映射和酶类分层。
Vanalyzer具有直观的图形用户界面(GUI)和按酶类过滤的功能,使得能够针对不同功能类别的蛋白质进行有针对性的比较。此外,Vanalyzer可以持续更新:随着新的含钒酸盐PDB条目的发布,研究人员可以重新运行分析,确保最新结构数据能够实时整合到他们的研究中。Vanalyzer的主要贡献包括:(i) 为每个钒酸盐位点自动分配多面体几何形状;(ii) 提供用户友好的GUI并支持按酶类过滤;(iii) 提供全面的统计输出(图表和表格),用于分析钒酸盐结合位点的组成;(iv) 采用开源实现,便于在新数据出现时进行复制和更新。
实现
为了更好地了解钒酸盐基团如何与蛋白质结合,我们在PDB网站上进行了全面搜索(https://www.rcsb.org)。截至2025年3月28日,PDB包含233,605个结构,其中220个含有钒配体,主要是钒酸盐(PDB配体ID:VO4),这些结构分布在136个蛋白质中。我们下载了这些含有钒酸盐的结构,并过滤掉了重复项、相似结构以及未在同行评审期刊上发表的结构。
架构与使用
为了提供用户友好的体验,我们使用Python的Tkinter库创建了Vanalyzer的GUI(图1中的截图https://docs.python.org/3/library/tkinter.html)。用户可以通过点击“浏览数据目录”按钮来选择数据集的目录路径。选定目录后,其路径将显示在“浏览”按钮旁边。然后,用户可以使用复选框选择至少一种酶类。为了方便使用,还有三个按钮:“选择”...
结果
我们使用Vanalyzer工具分析了我们过滤后的58个结构数据集中的钒酸盐配体的结合位点(表1)。该分析包括计算位于蛋白质表面结合界面的VO43?配体的键长和键角。此外,Vanalyzer还对这些结合界面中的氨基酸残基分布进行了统计评估,并根据每个结合位点的几何形状进行了分类。
讨论
我们开发了一个名为“Vanalyzer”的自动化工具,用于分析酶结合位点中的钒酸盐配体几何结构和氨基酸分布,从而提供了关于钒酸盐识别的宝贵见解。Vanalyzer根据键角和键长将结构分为两种几何类型:四面体(配位数4)和三角双锥体(配位数5)。正如预期的那样,四面体几何结构的键角为109.5°,而三角双锥体几何结构...
未来工作与应用
除了现有的分析能力外,Vanalyzer还可以扩展与机器学习(ML)框架集成,用于预测金属结合位点的建模。Vanalyzer提取的几何描述符、配位特征和氨基酸环境统计信息可以作为监督学习算法的输入特征,这些算法旨在识别或分类现有蛋白质结构中的潜在钒酸盐或金属结合区域。这种集成还可以实现计算机模拟...
CRediT作者贡献声明
Alexander Trachtenberg:撰写原始稿件、可视化、软件开发、方法论设计、正式分析。Barak Akabayov:审稿与编辑、撰写原始稿件、监督工作、软件开发、项目管理、资金申请、概念构思。
资助
本研究得到了以色列科学基金会(ISF)对B.A.的资助(资助编号:2414/25)和科技部对B.A.的资助(资助编号:8117002)的支持。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号