当前位置: 首页 » 资讯 » 新科技 » 正文

AlphaFold的下一步是什么?对话诺奖得主John Jumper

IP属地 中国·北京 DeepTech深科技 时间:2025-12-01 12:24:58


(MIT TR)

2017 年,刚刚从理论化学博士毕业不久的 John Jumper 听说,谷歌 DeepMind 正悄然从“打造能击败人类的游戏 AI”这条路线转向一个全新的秘密项目:利用人工智能预测蛋白质结构。他随即投递了简历。

三年后,他便迎来了足以载入科学史册的时刻。在 CEO Demis Hassabis 的合作领导下,他共同开发的 AI 系统 AlphaFold2,能够以接近一个原子宽度的精度预测蛋白质的三维结构——其准确度与实验室耗时数月的传统技术相当,却只需数小时即可得出结果。

AlphaFold2 攻克了生物学界 50 年来悬而未决的一道大题。“这是我创建 DeepMind 的理由。事实上,这也是我整个职业生涯投身 AI 的原因。”Hassabis 曾对笔者表示。


2024 年,Jumper 与 Hassabis 因这一突破共同获得诺贝尔化学奖。

五年前的这个星期,AlphaFold2 的横空出世让科学界震惊不已。如今热潮已退,它究竟带来了哪些真正持久的影响?科研人员现在如何使用它?它的下一步又将指向何方?笔者与 Jumper 进行了深入交谈。

“这五年非常不真实,”Jumper 笑着说,“我几乎已经记不得不认识这么多记者的日子了。”

在 AlphaFold2 之后,DeepMind 又推出了能够预测多蛋白复合体结构的 AlphaFold Multimer,以及速度更快的 AlphaFold3。团队还将 AlphaFold 应用于全球广泛使用的蛋白数据库 UniProt,如今已预测约 2 亿种蛋白质结构,几乎囊括了科学界已知的一切蛋白。

尽管影响巨大,Jumper 对 AlphaFold仍保持着科学家的谨慎:“这不意味着里面的每个预测都是确定无疑的。它是一个预测数据库,也携带着预测本身的全部局限。”



解开蛋白质之谜,为何如此艰难?

蛋白质是生命的“分子机器”。它们构成肌肉、羽毛、角,负责运送氧气、传递信号;它们让神经元放电、帮助我们消化食物、驱动免疫系统。这一切功能都依赖于它们折叠成的三维结构。

然而,要从一条氨基酸链推断其最终结构,极其困难。

蛋白可能折叠成天文数量级的结构,预测正确的那一个,就像在宇宙中找一枚硬币。Jumper 和团队采用了 Transformer 神经网络——与大语言模型同源——以捕捉序列中的遥远关联。

但 Jumper 认为真正的秘诀是他们迭代速度快:“我们做出了一个能以惊人速度给出错误答案的系统。正因为如此,我们才能大胆尝试各种想法。”

他们尽可能向模型灌注蛋白结构相关信息,如来自不同物种的演化线索。效果远超预期。“我们确信自己抓住了重大突破,确信这是一次理念上的飞跃。”

他没有预料到的是,研究人员会直接下载软件并立即用于如此广泛的用途。他说:通常来说,真正产生影响的是之后几代的版本,等一些问题被解决之后。“我对科学家们如何负责地使用它感到非常惊讶。无论是在理解上还是在实践中,他们使用它的程度恰好与它的可信程度相匹配,既不过度信任也不过低信任。”



有哪些令他印象深刻的应用?

蜜蜂的抗病研究。Jumper 提到一个团队,使用 AlphaFold 研究蜜蜂的抗病性:“他们想研究一种与蜂群崩溃有关的蛋白。我从没想过 AlphaFold 有一天会走进蜜蜂科学。”

“超出适应症”的创新用法。他特别提到几类不是 AlphaFold 本来设计用途,但却因其能力被开辟的新方向。

其一,蛋白设计。华盛顿大学的 David Baker(去年诺奖得主)利用 AlphaFold 的能力加速合成蛋白设计。他们开发了 RoseTTAFold,也尝试用 AlphaFold Multimer 来提前判断设计是否可行。“如果 AlphaFold 自信预测出你想要的结构,你就去做;若它犹豫不决,你就不做。光是这点,就让设计速度提升了十倍。”

其二,把 AlphaFold 当“结构搜索引擎”。两个研究组曾试图找出人类精子与卵子在受精时结合的关键蛋白。他们已知其中一个卵子蛋白,但不知道精子端的对应物。

于是他们拿已知的卵子蛋白让 AlphaFold 逐一预测与全部 2000 个精子表面蛋白的结合结构。AlphaFold 自信指出了某一个。随后的实验验证无误。“以前没人会做 2000 次结构比对来找一个答案,你现在可以做,这是 AlphaFold 真正改变科研方式的地方。”

AlphaFold2 面世时,笔者曾采访过几位早期使用者。五年后,我再次联系了其中一位,加州大学旧金山分校的分子生物学家Kliment Verba。“毫无疑问,它非常有用。我们每天都在用。”

但它也有明显的限制。许多科研问题涉及多个蛋白之间或蛋白与小分子之间的复杂互动,而 AlphaFold 在这类预测中的准确度较低。

Verba 说:“有时候你会拿到一个预测,让你琢磨半天,这到底是真是假?它处在模糊边界上。”他笑称:“有点像 ChatGPT——它把真话和胡话都说得同样自信。”

尽管如此,他们常用 AlphaFold(2 和 3)来做“虚拟实验”:先在电脑里筛选可能有价值的方向,再决定要不要投入真实实验室资源。“它没取代实验,但确实极大增强了实验效率。”



下一波浪潮

如今,许多初创公司和研究机构正在从 AlphaFold 出发,开发更专注于药物发现的模型

例如今年 MIT 的研究人员与 AI 药物公司 Recursion 合作,推出了一种名为 Boltz-2 的模型,它不仅能预测蛋白结构,还能预测潜在药物分子与其靶点的结合效果;上个月,初创公司 Genesis Molecular AI 发布了另一种结构预测模型 Pearl,该公司声称 Pearl 在某些与药物开发相关的问题上比 AlphaFold3 更准确。Pearl 是交互式的,可以让药物开发者将任何额外的数据输入模型,以指导预测。

那新药会因此更快出现吗?Jumper 并不乐观主义过头蛋白结构预测只是生物研究中的一步。我们不是只差一个结构就能治愈疾病。”

他打比方说:“如果我们真的只差十万美元(过去确定一个蛋白结构的成本)就能完成某事,那这件事早就被做了。”但他仍希望结构预测能发挥更大作用:“既然我们现在有一把威力巨大的锤子,那就尽量让它敲更多的钉子。”



接下来呢?

Jumper 的下一步计划,是把 AlphaFold 的“垂直深能力”与 LLM 的“横向理解能力”结合起来。“我们已经有能阅读科学文献、能进行部分科学推理的机器了;也有能在蛋白结构预测上达到超人水平的系统。现在的问题是:怎么让它们协同?”

这让笔者想到 DeepMind 另一个系统 AlphaEvolve——一个 LLM 生成假设,另一个模型负责筛选。它已在数学和计算机科学领域取得多个实际发现。

我问他是否也在做类似方向,他只是微笑。“我不便多说。但如果未来 LLM 在科学发现中的作用越来越大,我一点也不会意外。这是一个巨大而开放的问题。”

对于下一步的规划?Jumper 说:“这多少让我有些不安。我可能是 75 年来最年轻的化学奖得主。”

他补充:“我现在大概处在职业中点。我的策略是从一些小想法开始,慢慢沿着线索往下拉。下一次我发表的成果,不需要是第二个诺奖的候选。我认为那是个陷阱。”

https://www.technologyreview.com/2025/11/24/1128322/whats-next-for-alphafold-a-conversation-with-a-google-deepmind-nobel-laureate/

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。