当前位置: 首页 » 资讯 » 新科技 » 正文

Transformer之父NoamShazeer离开谷歌加入OpenAI

IP属地 中国·北京 三言科技 时间:2026-06-19 09:22:41

据字母AI,Google工程副总裁、Gemini模型联合负责人NoamShazeer宣布离开Google,加入OpenAI担任架构研究负责人。OpenAI首席研究官MarkChen确认了这一任命,SamAltman则表示从OpenAI创立之初就想与Shazeer合作,等了十年。

Shazeer是2017年论文《AttentionIsAllYouNeed》的核心作者之一,该论文提出的Transformer架构成为现代大模型的底层基础。此外,他还较早推动了稀疏MoE(混合专家模型)的发展。

Shazeer的职业生涯与Google多次“分分合合”。他于2000年首次加入Google,2009年短暂离开,2012年因被GoogleBrain团队吸引而回归。2017年参与发表Transformer论文后,他于2021年与同事DanielDeFreitas离开Google创办Character.AI,起因是Google拒绝公开发布他们开发的聊天机器人Meena。

2024年,Google通过一笔约27亿美元的技术授权与人才回流交易,将Shazeer及部分Character.AI团队重新请回,使其参与Gemini模型研发。Shazeer因持有Character.AI股份在这笔交易中获得了数亿美元收益。但不到两年后,他再次离开Google,转投OpenAI。

Shazeer的跳槽正值AI行业对Transformer架构局限性的反思期。业界认为,单纯扩大预训练规模的边际收益正在下降,Transformer在长上下文记忆、动态状态追踪和真正推理能力上存在结构性短板。下一代模型需要在架构层面实现突破,更好地维护状态、组织计算和更新对世界的表示。

对Google而言,这不仅是失去一位Gemini联合负责人,更折射出其在将前沿研究快速产品化方面的反复延迟。对OpenAI来说,Shazeer带来的大规模训练、MoE、高效解码等经验,以及从“小实验”走向“大系统”的架构判断能力,将助力其寻找Transformer之后的下一步。

当前,OpenAI面临沉重财务压力。据报道,其2025年支出约340亿美元,净亏损约390亿美元。与此同时,Anthropic等对手也在加紧人才布局,双方几乎同时提交IPO文件。前沿模型竞争正演变为一场围绕架构创新和人才争夺的昂贵战争。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。