AlphaFold蛋白质结构数据库2025重大更新:全新界面设计与扩展结构覆盖推动生命科学研究

《Nucleic Acids Research》:AlphaFold Protein Structure Database 2025: a redesigned interface and updated structural coverage

【字体: 时间:2025年11月23日 来源:Nucleic Acids Research 13.1

编辑推荐:

  本期推荐AlphaFold蛋白质结构数据库(AFDB)的重要更新。为解决结构生物学数据滞后问题,研究人员对AFDB进行了全面升级,通过重新设计用户界面、整合UniProt 2025_03数据、新增异构体预测和多重序列比对(MSAs)等功能,显著提升了数据库的可用性和结构覆盖范围。这一更新使AFDB继续保持为探索蛋白质序列-结构关系的重要资源。

  
在当今生命科学研究领域,蛋白质结构预测技术正以前所未有的速度推动着科学发现。自AlphaFold2问世以来,这一革命性技术已经彻底改变了结构生物学的研究范式。然而,随着蛋白质序列数据的爆炸式增长,如何保持预测数据库的时效性和可用性成为了新的挑战。AlphaFold蛋白质结构数据库(AFDB)作为这一领域的重要资源,近年来面临着与UniProt数据库同步滞后的问题,导致其无法覆盖新发现的蛋白质序列,限制了科研人员对最新数据的利用。
在这一背景下,EMBL-EBI与Google DeepMind的研究团队在《Nucleic Acids Research》上发表了AFDB的最新进展。该研究不仅解决了数据库更新的技术难题,更重要的是通过全面的重新设计,使这一宝贵资源更加符合现代科研需求。研究团队将AFDB与UniProt 2025_03版本进行了同步,恢复了数据库对不断扩展的蛋白质序列空间的覆盖能力。
关键技术方法包括:基于UniProt 2025_03释放版的数据同步技术、异构体特异性结构预测方法、多重序列比对(MSA)深度分析、结构域边界鉴定算法整合(使用三种深度学习域解析算法),以及CATH数据库(Version 4.4)的结构比对技术。样本数据来源于UniProt、MGnify和PDB等公共数据库。
增强的用户体验和功能
研究团队对AFDB进行了全面的界面重构,其中最突出的改进是结构查看器的功能增强。新的界面采用了标签页设计,将不同功能模块清晰分离,使非专业用户也能轻松进行复杂结构分析。结构查看器现在直接集成了注释信息,用户可以在查看三维模型的同时获取相关的结构特征信息。这种设计显著降低了使用门槛,使更广泛的研究群体能够受益于AlphaFold预测提供的强大洞察力。
数据更新
本次更新的核心内容是将AFDB与UniProt 2025_03释放版进行同步,并首次包含了Swiss-Prot/UniProtKB异构体的预测结果。这一扩展使得数据库能够更好地反映蛋白质组的多样性,研究人员可以观察到蛋白质结构域架构和相互作用界面的广泛变化。此外,研究团队还提供了用于结构预测的基础多重序列比对(MSAs)和MSA深度数据,为进化分析和结构研究提供了新的数据维度。
结构域百科全书集成
为了增强对蛋白质功能的理解,研究团队将结构域百科全书(TED)中的超过3.61亿个结构域注释整合到AFDB中,覆盖了1.65亿个蛋白质。TED方法采用最先进的共识策略,整合了三种基于深度学习的域解析算法,能够稳健地确定结构域边界。这些结构域分配随后使用结构比对算法与CATH数据库进行比对。每个结构域条目都配备了一套描述性和质量评估指标,包括反映三种域解析方法一致程度的共识水平,以及提供每个结构域分配质量综合测量的Qscore。
数据可获取性和API更新
AFDB始终坚持开放获取原则。所有数据均可通过官方网站获取,EMBL-EBI的FTP区域提供了46个生物体的蛋白质组TAR文件,包括模式生物和世界卫生组织关注的重要病原体。完整的AlphaFold数据集可从Google Cloud Public Datasets获取。为支持持续发展,AFDB正在引入对其API模式的重大更改,旧版API将于2026年6月退役。
研究结论与讨论
AFDB的最新更新标志着这一资源发展的重要里程碑。通过恢复与UniProt的同步和引入可扩展的界面设计,数据库不仅解决了时效性问题,还为未来的功能扩展奠定了坚实基础。异构体特异性预测和新生成的多重序列比对的加入,显著扩展了结构覆盖范围,并为模型提供了重要的生物学和进化背景。
这一进展对生命科学研究具有深远意义。它降低了结构信息研究的入门门槛,增强了研究的可重复性,促进了可持续和环保的研究实践。特别值得关注的是,AFDB已经成为了一个广泛使用的生物信息学资源,总用户数超过450万,蛋白质组档案下载量超过1.8万次,数据已被整合到主要的基础数据资源和分子可视化软件中。
展望未来,AFDB的发展将遵循三个核心原则:填补结构覆盖空白、改进现有模型以提升准确性和实用性、与科学界合作应对全球挑战。其中一个关键优先事项是以最大化科学影响的方式纳入结构模型及其验证。通过结合结构预测和丰富的社区贡献的功能见解,AFDB将继续发展成为加速科学发现的知识丰富型资源。
这项研究的成功得益于多个研究团队的紧密合作,包括Damian Bertoni、Maxim Tsenkov等核心贡献者,以及Google DeepMind和EMBL-EBI的持续支持。研究获得了BBRSC、Wellcome Trust、韩国国家研究基金会等多个机构的经费支持,体现了国际科学界对蛋白质结构预测资源建设的高度重视。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号