新华社快讯:瑞典皇家科学院9日宣布,将2024年诺贝尔化学奖授予三名科学家,以表彰他们在蛋白质设计和蛋白质结构预测领域作出的贡献。
10月9日,在瑞典斯德哥尔摩举行的2024年诺贝尔化学奖公布现场,屏幕显示奖项得主美国华盛顿大学的戴维·贝克、英国伦敦谷歌旗下人工智能公司“深层思维”的德米斯·哈萨比斯和约翰·江珀。新华社记者 彭子洋 摄
10月9日,在瑞典斯德哥尔摩举行的2024年诺贝尔化学奖公布现场,屏幕显示奖项得主美国华盛顿大学的戴维·贝克、英国伦敦谷歌旗下人工智能公司“深层思维”的德米斯·哈萨比斯和约翰·江珀。新华社记者 彭子洋 摄
化学家长期以来一直梦想着完全理解和掌握生命的化学工具——蛋白质。这个梦想现在已经触手可及。Demis Hassabis和John M. Jumper已成功利用人工智能来预测几乎所有已知蛋白质的结构。大卫·贝克学会了如何掌握生命的构建模块并创造全新的蛋白质。他们的发现潜力巨大。
生命的旺盛化学反应如何可能?这个问题的答案就是蛋白质的存在,蛋白质可谓是绝妙的化学工具。它们通常由 20 种氨基酸组成,可以以无数种方式组合。以 DNA 中存储的信息为蓝图,氨基酸在我们的细胞中连接在一起形成长串。
然后蛋白质的魔力发生了:一串氨基酸扭曲并折叠成一种独特的——有时是独特的——三维结构(图 1)。这种结构赋予了蛋白质功能。有些成为可以创造肌肉、角或羽毛的化学构件,而另一些则可能成为激素或抗体。其中许多会形成酶,以惊人的精确度驱动生命的化学反应。位于细胞表面的蛋白质也很重要,它们充当细胞与其周围环境之间的沟通渠道。
© Johan Jarnestad/瑞典皇家科学院这 20 种氨基酸是生命的化学组成部分,其潜力怎么强调都不为过。 2024 年诺贝尔化学奖旨在让人们在全新的水平上理解和掌握它们。一半的奖金授予 Demis Hassabis 和 John Jumper,他们利用人工智能成功解决了化学家 50 多年来一直困扰的问题:根据氨基酸序列预测蛋白质的三维结构。这使得他们能够预测几乎所有 2 亿种已知蛋白质的结构。奖金的另一半授予大卫·贝克。他开发了计算机化方法来实现许多人认为不可能的事情:创造以前不存在的蛋白质,并且在许多情况下具有全新的功能。
2024 年诺贝尔化学奖表彰了两项不同的发现,但正如您将看到的,它们密切相关。为了了解今年的获奖者克服的挑战,我们必须回顾现代生物化学的黎明。
自 19 世纪起,化学家就知道蛋白质对于生命过程很重要,但直到 20 世纪 50 年代化学工具才足够精确,研究人员才开始更详细地探索蛋白质。剑桥大学研究人员John Kendrew和Max Perutz在本世纪末取得了突破性的发现,他们成功地使用一种称为 X 射线晶体学的方法提出了第一个蛋白质的三维模型。为了表彰这一发现,他们于 1962 年获得了诺贝尔化学奖。
图 1.蛋白质可以由从数十个到数千个氨基酸的各种氨基酸组成。这串氨基酸折叠成三维结构,这对于蛋白质的功能至关重要。 ©Johan Jarnestad/瑞典皇家科学院 © Johan Jarnestad/瑞典皇家科学院随后,研究人员主要使用 X 射线晶体学(通常需要付出巨大的努力)成功生成约 200,000 种不同蛋白质的图像,这为 2024 年诺贝尔化学奖奠定了基础。
美国科学家克里斯蒂安·安芬森还有一项早期发现。他利用各种化学技巧,成功地使现有的蛋白质展开,然后再次折叠起来。有趣的观察是蛋白质每次都呈现完全相同的形状。 1961年,他得出结论:蛋白质的三维结构完全由蛋白质中的氨基酸序列决定。这使他于 1972 年荣获诺贝尔化学奖。
然而,安芬森的逻辑包含一个悖论,另一位美国人赛勒斯·莱文塔尔(Cyrus Levinthal)在1969年指出。他计算出,即使蛋白质仅由100个氨基酸组成,理论上该蛋白质也可以呈现至少10 47种不同的三维结构。如果氨基酸链随机折叠,则需要比宇宙年龄更长的时间才能找到正确的蛋白质结构。在细胞中,只需要几毫秒。那么这串氨基酸实际上是如何折叠的呢?
安芬森的发现和莱文塔尔的悖论暗示折叠是一个预定的过程。而且重要的是,有关蛋白质如何折叠的所有信息都必须存在于氨基酸序列中。
上述见解导致了另一个决定性的认识——如果化学家知道蛋白质的氨基酸序列,他们应该能够预测蛋白质的三维结构。这是一个令人兴奋的想法。如果他们成功了,他们将不再需要使用繁琐的 X 射线晶体学,并且可以节省大量时间。他们还能够生成 X 射线晶体学不适用的所有蛋白质的结构。
这些合乎逻辑的结论向生物化学面临的巨大挑战提出了挑战:预测问题。为了鼓励该领域更加快速的发展,研究人员于 1994 年启动了一个名为“蛋白质结构预测批判性评估” (CASP) 的项目,该项目后来发展成为一项竞赛。每隔一年,来自世界各地的研究人员就可以获得结构刚刚确定的蛋白质中的氨基酸序列。然而,这些结构对参与者保密。挑战是根据已知的氨基酸序列预测蛋白质结构。
CASP 吸引了许多研究人员,但事实证明解决预测问题极其困难。研究人员在竞赛中输入的预测与实际结构之间的一致性几乎没有任何改善。这一突破直到 2018 年才出现,当时一位国际象棋大师、神经科学专家和人工智能先驱进入了该领域。
让我们快速了解一下 Demis Hassabis 的背景:他四岁开始下棋,13 岁达到大师水平。在他十几岁的时候,他开始了程序员和成功的游戏开发人员的职业生涯。他开始探索人工智能并研究神经科学,并取得了多项革命性的发现。他利用自己对大脑的了解为人工智能开发了更好的神经网络。 2010 年,他与他人共同创立了 DeepMind 公司,该公司为流行的棋盘游戏开发精湛的人工智能模型。该公司于 2014 年被出售给谷歌,两年后,当该公司实现了当时许多人认为的人工智能圣杯:击败世界上最古老的棋盘游戏之一围棋的冠军选手时,DeepMind 引起了全球关注。
然而,对于 Hassabis 来说,Go 并不是目标,而是开发更好的 AI 模型的手段。这场胜利之后,他的团队已经准备好解决对人类更重要的问题,因此在 2018 年,他报名参加了第十三届 CASP 竞赛。
前几年,研究人员预测的 CASP 蛋白质结构的准确度最多只有 40%。借助 AI 模型 AlphaFold,Hassabis 的团队达到了近 60%。他们赢了,优异的成绩让很多人都大吃一惊——这是意想不到的进步,但解决方案仍然不够好。为了获得成功,与目标结构相比,预测的准确度必须达到 90%。
图 2.AlphaFold2 是如何工作的? © Johan Jarnestad/瑞典皇家科学院哈萨比斯和他的团队继续开发 AlphaFold——但是,无论他们如何努力,该算法从未完全成功。残酷的事实是,他们已经走进了死胡同。团队很疲惫,但一位相对较新的员工对如何改进人工智能模型有决定性的想法:约翰·詹珀 (John Jumper)。
约翰·詹珀对宇宙的迷恋促使他开始学习物理和数学。然而,2008 年,当他开始在一家使用超级计算机模拟蛋白质及其动力学的公司工作时,他意识到物理知识可以帮助解决医学问题。
2011 年,当詹珀开始攻读理论物理学博士学位时,他对蛋白质产生了新的兴趣。为了节省计算机容量(大学里紧缺的东西),他开始开发更简单、更巧妙的方法来模拟蛋白质动力学。很快,他也接受了生物化学这一巨大挑战的挑战。 2017 年,当他刚刚完成博士学位时,他听到了谷歌 DeepMind 已经开始秘密预测蛋白质结构的传言。他向他们发送了一份工作申请。他在蛋白质模拟方面的经验意味着他对如何改进 AlphaFold 有创造性的想法,因此,在团队开始停滞不前后,他得到了晋升。 Jumper 和 Hassabis 共同领导了从根本上改革人工智能模型的工作。
新版本——AlphaFold2——是根据跳跃者的蛋白质知识来着色的。该团队还开始使用人工智能最近取得的巨大突破背后的创新:称为Transformer 的神经网络。这些可以比以前更灵活的方式在大量数据中找到模式,并有效地确定应该关注什么来实现特定目标。
该团队利用所有已知蛋白质结构和氨基酸序列数据库中的大量信息对 AlphaFold2 进行了训练(图 2),新的 AI 架构开始及时为第十四届 CASP 竞赛提供良好的结果。
2020 年,当 CASP 的组织者评估结果时,他们明白生物化学长达 50 年的挑战已经结束。在大多数情况下,AlphaFold2 的表现几乎与 X 射线晶体学一样好,这令人震惊。当 CASP 创始人之一 John Moult 于 2020 年 12 月 4 日结束比赛时,他问道:现在怎么办?
我们将回到这一点。现在我们要回到过去,了解 CASP 的另一位参与者。让我们介绍 2024 年诺贝尔化学奖的另一半,它涉及从头开始创造新蛋白质的艺术。
当大卫·贝克开始在哈佛大学学习时,他选择了哲学和社会科学。然而,在进化生物学课程中,他偶然发现了现在经典教科书《细胞分子生物学》的第一版。这导致他改变了人生的方向。他开始探索细胞生物学,最终对蛋白质结构着迷。 1993 年,当他开始担任西雅图华盛顿大学的小组组长时,他接受了生物化学领域的巨大挑战。通过巧妙的实验,他开始探索蛋白质如何折叠。当他在 20 世纪 90 年代末开始开发可以预测蛋白质结构的计算机软件:Rosetta 时,这为他提供了深刻的见解。
Baker 在 1998 年使用 Rosetta 首次参加 CASP 比赛,与其他参赛者相比,表现非常好。这一成功引发了一个新想法——大卫·贝克的团队可以反向使用该软件。他们应该能够输入所需的蛋白质结构并获得有关其氨基酸序列的建议,而不是在 Rosetta 中输入氨基酸序列并得出蛋白质结构,这将使他们能够创造出全新的蛋白质。
蛋白质设计领域——研究人员创造具有新功能的定制蛋白质——于 20 世纪 90 年代末开始腾飞。在许多情况下,研究人员对现有的蛋白质进行了调整,这样它们就可以做一些事情,比如分解有害物质或充当化学制造业的工具。
然而,天然蛋白质的范围是有限的。为了增加获得具有全新功能的蛋白质的潜力,贝克的研究小组希望从头开始创造它们。正如贝克所说:“如果你想制造一架飞机,你不能从改造一只鸟开始;而是要从改造一只鸟开始。”相反,你了解空气动力学的首要原理,并根据这些原理建造飞行器。”
图 3. Top7 – 第一个与所有已知现有蛋白质完全不同的蛋白质。 ©Terezia Kovalova/瑞典皇家科学院构建全新蛋白质的领域称为从头设计。研究小组绘制了一种具有全新结构的蛋白质,然后让 Rosetta 计算出哪种类型的氨基酸序列可以产生所需的蛋白质。为此,Rosetta 搜索了所有已知蛋白质结构的数据库,并寻找与所需结构相似的蛋白质短片段。 Rosetta 利用蛋白质能量景观的基础知识优化了这些片段并提出了氨基酸序列。
为了研究该软件的成功程度,贝克的研究小组在产生所需蛋白质的细菌中引入了拟议氨基酸序列的基因。然后他们使用 X 射线晶体学确定了蛋白质结构。
事实证明,罗塞塔真的可以构建蛋白质。研究人员开发的蛋白质Top7几乎与他们设计的结构完全相同。
对于从事蛋白质设计的研究人员来说,Top7 是晴天霹雳。那些以前从头创造蛋白质的人只能模仿现有的结构。 Top7的独特结构在自然界中并不存在。此外,该蛋白质含有 93 个氨基酸,比以前使用从头设计生产的任何蛋白质都要大。
贝克于 2003 年发表了他的发现。这是只能被描述为非凡发展的第一步。 Baker 实验室创造的众多令人惊叹的蛋白质中的一些如图 4 所示。他还发布了 Rosetta 的代码,因此全球研究社区继续开发该软件,寻找新的应用领域。
是时候解决 2024 年诺贝尔化学奖的悬而未决的事情了。现在怎么办?
图 4.使用 Baker 的 Rosetta 程序开发的蛋白质。 ©Terezia Kovalova/瑞典皇家科学院当 Demis Hassabis 和 John Jumper 确认 AlphaFold2 确实有效后,他们计算了所有人类蛋白质的结构。然后,他们预测了研究人员迄今为止在绘制地球生物图时发现的几乎所有 2 亿种蛋白质的结构。
谷歌 DeepMind 还公开了 AlphaFold2 的代码,任何人都可以访问它。人工智能模型已成为研究人员的金矿。截至 2024 年 10 月,AlphaFold2 已被来自 190 个国家的超过 200 万人使用。以前,如果有的话,通常需要数年时间才能获得蛋白质结构。现在只需几分钟即可完成。人工智能模型并不完美,但它估计了其生成的结构的正确性,因此研究人员知道预测的可靠性。图 5 显示了 AlphaFold2 如何帮助研究人员的众多示例中的几个。
2020 年 CASP 竞赛结束后,当 David Baker 意识到基于 Transformer 的 AI 模型的潜力时,他在 Rosetta 中添加了一个模型,这也促进了蛋白质的从头设计。近年来,贝克实验室不断创造出令人难以置信的蛋白质(图 4)。
图 5.使用 AlphaFold2 确定的蛋白质结构。 ©Terezia Kovalova/瑞典皇家科学院蛋白质作为化学工具的惊人多功能性体现在生命的巨大多样性上。我们现在可以如此轻松地想象这些小分子机器的结构,这真是令人难以置信。它使我们能够更好地了解生命的运作方式,包括为什么会出现一些疾病、抗生素耐药性是如何发生的或者为什么一些微生物可以分解塑料。
创造具有新功能的蛋白质的能力同样令人震惊。这可以带来新的纳米材料、靶向药物、更快速的疫苗开发、最小的传感器和更绿色的化学工业——仅举几个为人类带来最大利益的应用。
有关今年奖项的更多信息,包括英语科学背景,请访问瑞典皇家科学院网站 www.kva.se 和 www.nobelprize.org,您可以在其中观看新闻发布会的视频、诺贝尔讲座等等。有关诺贝尔奖和经济科学奖相关展览和活动的信息,请访问 www.nobelprizemuseum.se。
与二分之一
大卫·贝克 (DAVID BAKER)
1962 年出生于美国华盛顿州西雅图。 1989年获得美国加州大学伯克利分校博士学位。美国华盛顿州西雅图华盛顿大学教授。
“用于计算蛋白质设计”
和另一半共同
德米斯·哈萨比斯 (DEMIS HASSABIS)
1976 年出生于英国伦敦。 2009年获得英国伦敦大学学院博士学位。谷歌 DeepMind 首席执行官,英国伦敦。
JOHN M. JUMPER
1985 年出生于美国阿肯色州小石城。 2017年获得美国伊利诺伊州芝加哥大学博士学位。英国伦敦 Google DeepMind 高级研究科学家。
“用于蛋白质结构预测”
科学编辑: Peter Brzezinski、Heiner Linke、Johan Åqvist,诺贝尔化学委员会
文本: Ann Fernholm
译者: Clare Barnes
插图:Johan Jarnestad、Terezia Kovalova
编辑: Vincent von Sydow
© 瑞典皇家科学院
引用本节
MLA风格:热门信息。 NobelPrize.org。 2024 年诺贝尔奖外展 AB。周三。 2024 年 10 月 9 日。