据字母AI,Google工程副总裁、Gemini模型联合负责人NoamShazeer宣布离开Google,加入OpenAI担任架构研究负责人。OpenAI首席研究官MarkChen确认了这一任命,SamAltman则表示从OpenAI创立之初就想与Shazeer合作,等了十年。
Shazeer是2017年论文《AttentionIsAllYouNeed》的核心作者之一,该论文提出的Transformer架构成为现代大模型的底层基础。此外,他还较早推动了稀疏MoE(混合专家模型)的发展。
Shazeer的职业生涯与Google多次“分分合合”。他于2000年首次加入Google,2009年短暂离开,2012年因被GoogleBrain团队吸引而回归。2017年参与发表Transformer论文后,他于2021年与同事DanielDeFreitas离开Google创办Character.AI,起因是Google拒绝公开发布他们开发的聊天机器人Meena。
2024年,Google通过一笔约27亿美元的技术授权与人才回流交易,将Shazeer及部分Character.AI团队重新请回,使其参与Gemini模型研发。Shazeer因持有Character.AI股份在这笔交易中获得了数亿美元收益。但不到两年后,他再次离开Google,转投OpenAI。
Shazeer的跳槽正值AI行业对Transformer架构局限性的反思期。业界认为,单纯扩大预训练规模的边际收益正在下降,Transformer在长上下文记忆、动态状态追踪和真正推理能力上存在结构性短板。下一代模型需要在架构层面实现突破,更好地维护状态、组织计算和更新对世界的表示。
对Google而言,这不仅是失去一位Gemini联合负责人,更折射出其在将前沿研究快速产品化方面的反复延迟。对OpenAI来说,Shazeer带来的大规模训练、MoE、高效解码等经验,以及从“小实验”走向“大系统”的架构判断能力,将助力其寻找Transformer之后的下一步。
当前,OpenAI面临沉重财务压力。据报道,其2025年支出约340亿美元,净亏损约390亿美元。与此同时,Anthropic等对手也在加紧人才布局,双方几乎同时提交IPO文件。前沿模型竞争正演变为一场围绕架构创新和人才争夺的昂贵战争。





京公网安备 11011402013531号