DrugDomain 2.0:基于全蛋白质数据库的蛋白质结构域-配体/药物互作全景图谱及其在AI预测中的应用

【字体: 时间:2025年09月16日 来源:Computational and Structural Biotechnology Journal 4.1

编辑推荐:

  研究人员针对蛋白质结构域-配体互作缺乏系统性图谱的问题,开发了DrugDomain 2.0数据库。该研究整合PDB全库17万+结构、4.3万UniProt条目与AI预测模型,首次实现ECOD分类体系下结构域-配体互作的全局映射,涵盖3.7万配体及7561种药物,并创新性引入14,000+ PTM修饰模型。该资源为结构生物学、药物重定位及PTM功能研究提供了重要基础设施。

  

在生命活动的微观世界里,蛋白质如同精密运作的分子机器,它们通过与各种小分子配体的特异性结合来执行信号传导、代谢调控等关键功能。这些相互作用往往发生在蛋白质的三维结构域中——这些结构域是进化过程中高度保守的功能单元,就像乐高积木一样通过不同组合衍生出丰富的生物功能。尽管科学家们已建立SCOP、CATH等结构分类系统,但长期以来缺乏一个系统描绘结构域与配体相互作用全景图的知识库,这严重限制了我们对药物作用机制的理解和精准药物设计的能力。

更令人振奋的是,随着AlphaFold等人工智能技术的突破,蛋白质结构预测精度已达到原子水平,为填补实验数据的空白提供了全新可能。然而,如何将这些预测模型转化为实际可用的生物医学知识,仍存在巨大挑战。正是在这样的背景下,来自德克萨斯大学西南医学中心的Kirill E. Medvedev团队在《Computational and Structural Biotechnology Journal》发表了这项开创性研究。

研究人员采用多学科交叉的研究策略:首先通过rcsb-api获取PDB全库配体数据,利用BioPython分析5?范围内的相互作用残基;其次整合ECOD v292结构域分类系统,建立结构域-配体映射关系;针对缺乏实验结构的靶点,采用AlphaFill算法将配体移植至AlphaFold预测模型;创新性地运用AlphaFold3、RoseTTAFold All-Atom等AI工具构建了14,178个PTM修饰蛋白-配体复合物模型。数据涵盖43,023个UniProt条目和174,545个PDB结构。

3.1. DrugDomain v2.0统计特征

研究构建的数据库包含37,367个PDB配体和7,561个DrugBank药物分子,覆盖超过70%的实验蛋白结构。通过进化分类分析发现,配体结合域主要集中于三大ECOD架构类型:α/β三明治结构(Rossmann折叠)、α+β双层(热休克蛋白)和α+β复合拓扑(激酶)。配体化学分类显示,有机杂环化合物、有机含氧化合物和有机酸衍生物是最常见的三大超类。

3.2. PDB中配体相互作用域的数量规律

统计分析揭示约75%的蛋白质通过1-2个结构域结合配体,但存在特殊案例:如线粒体Mrs2镁离子通道通过10个结构域协同配位Mg2+,其五聚体结构中每个单体贡献2个ECOD结构域参与离子通道形成。研究还以ATP为例展示其与1,035种蛋白的多样化结合模式,包括泛素激活酶Atg7的Rossmann结构域、ABC转运体的P-loop结构域等进化无关的结合口袋。

  1. 4.

    结论与展望

    该研究创建的DrugDomain 2.0实现了三大突破:首次完成PDB全库结构域-配体互作系统编目;开创性地将AI预测模型与实验数据整合;建立最大规模的PTM-配体关联数据集。这些突破使得该资源在多个领域具有重要价值:在基础研究层面,为理解蛋白质功能进化提供新视角;在药物研发领域,支持基于结构域的药物重定位和变构调节剂设计;在精准医疗方面,6,131个配体相关PTM的发现为疾病机制研究提供新线索。随着AlphaFold3等技术的迭代升级,这种将实验数据与AI预测相结合的研究范式,必将推动结构生物学进入新的发展阶段。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号