DeepMind和EMBL联手发布迄今为止最完整的人类蛋白质三维结构预测数据库

【字体: 时间:2021年07月27日 来源:Nature

编辑推荐:

  DeepMind正与EMBL合作,免费向科学界开放最完整、最准确的人类蛋白质结构预测数据库。AlphaFold蛋白质结构数据库将使研究能够推进对这些生命基石的理解,加速各个领域的研究。AlphaFold的影响已经在研究被忽视疾病、研究抗生素耐药性和回收一次性塑料的早期合作伙伴中得到了体现。

  

 

   

IMAGE

图像:通过AlphaFold获得数据的蛋白质结构

 

 

DeepMind于2021年7月22日宣布与欧洲生命科学旗舰实验室欧洲分子生物学实验室(EMBL)合作,为人类蛋白质组建立迄今最完整、最准确的预测蛋白质结构模型数据库。这将涵盖人类基因组表达的所有约2万个蛋白质,数据将向科学界免费开放。该数据库和人工智能系统为结构生物学家提供了检查蛋白质三维结构的强大新工具,并提供了一个宝贵的数据宝库,可能开启未来的进步,并预示着AI支持的生物学的新时代。

AlphaFold于2020年12月被蛋白质结构预测关键评估(CASP)基准的组织者认可为解决蛋白质结构预测这一具有50年历史的重大挑战的解决方案,这是该领域的一个惊人突破。

AlphaFold蛋白质结构数据库建立在这一创新和几代科学家的发现之上,从蛋白质成像和晶体学的早期先驱,到成千上万的预测专家和结构生物学家,他们此后花了数年时间对蛋白质进行实验。该数据库极大地扩展了有关蛋白质结构的知识积累,使研究人员获得的高精度人类蛋白质结构的数量增加了一倍多。推进对这些构成生命的基石的理解,将有助于各个领域的研究人员加速他们的工作。这些基石支撑着每一种生物的每一个生物过程。

上周,《自然》(Nature)杂志发表了最新高度创新版本AlphaFold背后的方法论及其开放源代码。去年12月,AlphaFold宣布推出了一个复杂的人工智能系统,为这些结构预测提供了动力。今天的公告恰逢《自然》杂志发表第二篇论文,提供了构成人类蛋白质组的蛋白质的完整图像,并发布了另外20种对生物学研究很重要的生物体。

DeepMind创始人兼首席执行官Demis Hassabis博士表示:“我们在DeepMind的目标一直是构建人工智能,然后利用它作为一种工具,帮助加快科学发现本身的步伐,从而促进我们对周围世界的理解。我们使用AlphaFold生成了最完整、最准确的人类蛋白质组图。我们认为,这是迄今为止人工智能对推进科学知识做出的最重大贡献,也是人工智能可以给社会带来各种好处的一个很好的例证。”

AlphaFold已经在帮助科学家加速发现

 

从蛋白质的氨基酸序列计算出蛋白质形状的能力——而不是通过多年艰苦、费力和通常昂贵的技术来实验性地确定它——已经帮助科学家在几个月内实现了以前需要几年才能实现的目标。

“AlphaFold数据库是开放科学良性循环的一个完美例子,”EMBL局长Edith Heard说。"lphaFold的训练使用的是科学界建立的公共资源的数据,所以它的预测公开是有道理的。公开和自由地分享AlphaFold预测将使世界各地的研究人员获得新的见解和推动发现。我相信AlphaFold是生命科学真正的一场革命,就像几十年前的基因组学一样。我很自豪EMBL能够帮助DeepMind开放获取这一非凡的资源。”

“被忽视疾病药物计划”( Drugs for Neglected Diseases Initiative, DNDi)等合作伙伴已经在使用AlphaFold,该计划推进了对那些严重影响世界贫困地区的疾病的救命疗法的研究,酶创新中心(CEI)正在使用AlphaFold帮助加快酶的开发,以回收一些污染最严重的一次性塑料。对于那些依赖实验蛋白质结构测定的科学家来说,AlphaFold的预测有助于加速他们的研究。例如,科罗拉多大学博尔德分校(University of Colorado Boulder)的一个团队发现,有希望利用AlphaFold预测来研究抗生素耐药性,而加州大学旧金山分校(University of California San Francisco)的一个团队已经利用它们来增加对SARS-CoV-2生物学的理解。

AlphaFold蛋白质结构数据库

 

AlphaFold蛋白质结构数据库*基于国际科学界的许多贡献,以及AlphaFold复杂的算法创新和EMBL-EBI在分享世界生物数据方面的数十年经验。DeepMind和EMBL的欧洲生物信息学研究所(EMBL-EBI)正在提供AlphaFold的预测,以便其他人可以使用该系统作为工具,以促进和加速研究,并开辟科学发现的全新途径。

“这将是自绘制人类基因组以来最重要的数据集之一,”EMBL副主任和EMBL-EBI主任Ewan Birney说。“让AlphaFold能够对国际科学界进行预测,为许多新的研究途径打开了大门,从被忽视的疾病到用于生物技术的新酶,以及介于两者之间的一切。这是一个伟大的新的科学工具,它补充了现有的技术,并将允许我们推动我们对世界的理解边界。”

除了人类蛋白质组外,该数据库还包含约35万个结构,包括20个具有生物学意义的生物体,如大肠杆菌、果蝇、小鼠、斑马鱼、疟疾寄生虫和结核病细菌。对这些生物体的研究已经成为无数研究论文和重大突破的主题。这些结构将使从神经科学到医学等众多领域的研究人员能够加快他们的工作。

AlphaFold的未来

 

随着我们继续投资于AlphaFold的未来改进,该数据库和系统将定期更新,在未来几个月里,我们计划大幅扩大覆盖范围,几乎涵盖科学已知的每一个测序蛋白——超过1亿个结构,覆盖了UniProt参考数据库的大部分。

 

###

来自独立首席科学家们的评论:

Paul Nurse,2001年诺贝尔生理学或医学奖得主,弗朗西斯·克里克研究所主任,EMBL科学顾问委员会主席

“计算方法正在改变科学研究,为公共利益的发现和应用开辟了新的可能性。了解蛋白质的功能对于提高我们对生命的认识至关重要,并最终将导致医疗保健、食品可持续性、新技术等方面的改善。DeepMind与欧洲分子生物学旗舰组织EMBL共同发布的AlphaFold蛋白质结构数据库,是生物创新的一次巨大飞跃,展示了跨学科合作对科学进步的影响。有了这种免费和公开可用的资源,科学界将能够利用集体知识加速发现,引领人工智能生物学的新时代。”

Venki Ramakrishnan, 2009年诺贝尔化学奖得主,英国皇家学会前主席

“这项计算工作代表了蛋白质折叠问题的惊人进展,这个生物学上的重大挑战已有50年之久。这比许多业内人士所预料的要早得多。它将以多种方式从根本上改变生物学研究,这将是令人兴奋的。”

Elizabeth Blackburn,2009年诺贝尔生理学或医学奖得主,加州大学旧金山分校名誉教授

“随着这些由DeepMind开创的蛋白质结构的革命性方法变得可行,这将为科学界打开基因组序列生物学意义的新窗口。”

Patrick Cramer,马克斯·普朗克生物物理化学研究所主任

“DeepMind和EMBL提供的奇妙资源将改变我们研究结构生物学的方式。这些预测证明了机器学习的力量,并服务于全球社区,这些社区提供了开放数据,使这一突破性成就成为可能。这是21世纪科学发展的重要范例。”

研究合作伙伴使用AlphaFold的评论:

Ben Perry,被忽视疾病药物计划(DNDi)发现开放创新领袖

“我们需要为世界各地数百万面临被忽视疾病风险的人加强新药的发现。人工智能可以改变游戏规则:通过快速准确地预测蛋白质结构,AlphaFold打开了新的研究视野,提高了研发的范围和效率,并促进了我们在流行国家的研究。看到强大的尖端人工智能为治疗几乎只集中在贫困人口的疾病提供了可能,这是令人鼓舞的。”

John McGeehan,结构生物学教授,朴茨茅斯大学酶创新中心主任

“我们的任务是开发塑料循环回收的酶催化解决方案。这项技术正在以一种前所未有的方式加速我们的研究。DeepMind提供的这种开放访问将改变整个社区,并允许每个人进行这类实验。我们花了数月甚至数年时间才完成的事情,AlphaFold只用了一个周末就完成了。我觉得我们比昨天的情况提前了至少一年。

Marcelo Sousa,科罗拉多大学博尔德分校生物化学系

“AlphaFold的预测最终解决了我们执着了10多年的实验数据,帮助加快了我们对抗生素耐药性的研究。这些预测非常准确,一开始我还以为是我的设置出错了呢!”

来自DeepMind / Alphabet的评价:

Sundar Pichai,谷歌和Alphabet的首席执行官

“AlphaFold数据库显示了人工智能在深刻加速科学进步方面的潜力。DeepMind的机器学习系统不仅一夜之间极大地扩展了我们在蛋白质结构和人类蛋白质组方面积累的知识,而且它对生命构建模块的深刻见解为未来的科学发现带来了非凡的希望。”

Pushmeet Kohli博士,DeepMind人工智能科学主管

“我们的团队一直在研究AlphaFold,通过预测蛋白质的结构来破译和解锁蛋白质世界。我们正在通过数据库向每个人提供AlphaFold的预测,以最大限度地利用这些见解取得科学进展。这个数据库和AlphaFold有潜力开辟科学探索的新途径,最终将推进我们对生物学和生命本身的许多领域的理解。我们相信,这将对与健康和疾病、药物设计过程和环境可持续性有关的问题的研究产生变动性的影响,并非常兴奋地看到在未来几个月和几年里开发出哪些应用。”

John Jumper博士,DeepMind AlphaFold首席研究员

“随着数据库的扩展,几乎每一种编目蛋白质的模型都将可用。AlphaFold DB可能会改变我们研究生物信息学的方式,即对DNA和蛋白质的大规模研究,因为它将使我们能够以接近原子的精度研究所有已知生物体的蛋白质。我们乐观地认为,AlphaFold的前景和机器学习的进步将刺激蛋白质研究一个令人兴奋的新阶段的发展,在这个新阶段,深度学习工具能够与实验方法携手定量理解生物学。”

Kathryn Tunyasuvunakool博士,DeepMind研究科学家

“AlphaFold模型可以通过实验方法帮助确定结构。对结构进行足够准确的初步预测,将使研究人员能够重新访问和解决以前无法建立模型的旧x射线数据集和低温电磁地图。这是一个很好的例子,说明了计算方法是如何与实验方法互补的。”

来自EMBL的声音:

Dame Janet Thornton, EMBL-EBI荣誉董事

“AlphaFold的预测基于过去50年世界各地科学家收集的数据,其基础是人工智能的力量。使这些模型可用无疑将激励实验和理论蛋白质结构研究人员将这些新知识应用到他们自己的研究领域,并开辟新的兴趣领域。这有助于我们对生命系统的知识和理解,这将为人类开启所有机会。”

Sameer Velankar,EMBL-EBI部门主管

“在人类基因组革命20年后,AlphaFold是生物学研究的重大突破。蛋白质的功能由其结构决定,AlphaFold蛋白质结构数据库将提供数百万预测的蛋白质结构,加速发现过程。这一前所未有的规模将引发新一轮创新浪潮,帮助我们应对从健康到气候变化的挑战。”

Christoph Müller, EMBL结构和计算生物学部门负责人

“这是一个巨大的进步。AlphaFold结构预测将大大加快结构生物学研究,并将使三维蛋白质结构在生命科学研究中更加引人注目。”

相关论文:

  1. John Jumper, Richard Evans, Alexander Pritzel, Tim Green, Michael Figurnov, Olaf Ronneberger, Kathryn Tunyasuvunakool, Russ Bates, Augustin Žídek, Anna Potapenko, Alex Bridgland, Clemens Meyer, Simon A. A. Kohl, Andrew J. Ballard, Andrew Cowie, Bernardino Romera-Paredes, Stanislav Nikolov, Rishub Jain, Jonas Adler, Trevor Back, Stig Petersen, David Reiman, Ellen Clancy, Michal Zielinski, Martin Steinegger, Michalina Pacholska, Tamas Berghammer, Sebastian Bodenstein, David Silver, Oriol Vinyals, Andrew W. Senior, Koray Kavukcuoglu, Pushmeet Kohli, Demis Hassabis. Highly accurate protein structure prediction with AlphaFold. Nature, 2021; DOI: 10.1038/s41586-021-03819-2

  2. Kathryn Tunyasuvunakool, Jonas Adler, Zachary Wu, Tim Green, Michal Zielinski, Augustin Žídek, Alex Bridgland, Andrew Cowie, Clemens Meyer, Agata Laydon, Sameer Velankar, Gerard J. Kleywegt, Alex Bateman, Richard Evans, Alexander Pritzel, Michael Figurnov, Olaf Ronneberger, Russ Bates, Simon A. A. Kohl, Anna Potapenko, Andrew J. Ballard, Bernardino Romera-Paredes, Stanislav Nikolov, Rishub Jain, Ellen Clancy, David Reiman, Stig Petersen, Andrew W. Senior, Koray Kavukcuoglu, Ewan Birney, Pushmeet Kohli, John Jumper, Demis Hassabis. Highly accurate protein structure prediction for the human proteome. Nature, 2021; DOI: 10.1038/s41586-021-03828-1



相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号