meta 的超级智能实验室 Superintelligence 才刚刚拉开大幕,资金、算力应有尽有,CEO 小扎更是亲自下场喊口号,势必要让「人人都有超级智能」。
可偏偏就在这个时候,meta 研究科学家 Rishabh Agarwal 刚刚发推官宣——他要走人了。
来品品他的离职宣言:
「这是我在 @AIatmeta 的最后一周。是否继续加入新的 Superintelligence TBD 实验室对我来说是一个艰难的决定,尤其是在那样的人才与算力高度集中的环境下。但在 Google Brain、DeepMind 和 meta 度过了 7.5 年之后,我还是感受到一种驱动力——去承担一种不同类型的风险。」
听到这里是不是觉得,噢,这就是常规离职套话?别急,他还补了一刀:
「Mark 和 Alexandr Wang 提出的加入 Superintelligence 团队的愿景极具吸引力。但最终我选择遵循 Mark 本人的建议:『在一个变化如此之快的世界里,你能冒的最大风险就是不冒任何风险。』」
笑死,没想到原本扎克伯格掏心掏肺的毒鸡汤,直接成了 Rishabh 递辞职信的理由。
而为了赢得 AI 竞赛,最近的 meta 的招聘节奏也是异常激进。
小扎向不少顶级研究员开出了高达九位数美元的薪酬,甚至亲自通过电子邮件和 WhatsApp 等方式从 OpenAI、Google 等公司招募人才,开出的总薪酬有时能达到 1 亿美元。
截至 8 月中旬,meta 已成功从 OpenAI 挖走超 20 人,从 Google 挖走至少 13 人,3 名来自苹果 ,3 名来自 xAI,2 名来自 Anthropic,总计新员工超过 50 名。
然而,最近有传言称,meta 在持续数月大举招揽了超过 50 名 AI 研究员和工程师后,已于上周开始冻结其 AI 部门的人员招聘,并全面缩减 AI 部门规模,重组 AI 团队。
meta AI 业务将被重组为研究、训练(TBD Lab 待确定实验室)、产品和基础设施四个核心团队 ,大部分团队负责人都将直接向Wang汇报。此前负责 Llama 大模型的 AGI 基金会团队也在此次重组中被正式解散。
或许 Rishabh 也受到了重组风波影响。
不过,Rishabh 在 meta 的时候可不是混日子的。根据他的描述,在短短几个月里,他就和团队折腾出了不少成果,比如推动了在「思考型」模型在后训练方面的进展。
具体包括:
通过 RL 扩展,将一个 80 亿参数的稠密模型推到了接近 Deepseek-R1 的性能。
在中期训练中使用合成数据,以便更好地启动 RL。
开发了更优的 on-policy 蒸馏方法。
细看 Rishabh 的履历,在 AI 圈也算上实力派选手。
他本科毕业于印度理工学院孟买分校,主修计算机科学与工程。随后他在加拿大魁北克人工智能研究所 Mila 攻读博士,论文方向是深度强化学习的突破性探索,师从 Aaron Courville 和 Marc Bellemare。
Google Scholar 显示,他参与并发表了一系列有影响力的研究论文,包括 Gemini 1.5 与 Gemma 2 ,引用量分别超过 2500 和 1200 次;2021 年的《Deep Reinforcement Learning at the Edge of the Statistical Precipice》和《Neural Additive Models》也都有较高影响力。
整体来看,他的学术引用总数已超过 1 万次,h-index 为 34,i10-index 为 41。研究领域也覆盖得很全面——多模态理解、开放语言模型、可解释性神经网络,还有离线强化学习,基本上把当下最热门的几个方向都摸了个遍。
工作经历方面,他目前在麦吉尔大学担任兼职教授,自 2024 年 9 月起任职至今,在加入 meta 之前,他在 2023 年至 2025 年期间任职于 Google DeepMind,担任研究科学家,研究内容聚焦于强化学习、自我改进与大语言模型的蒸馏。
此外,他在 Google Brain 工作了 5 年,担任高级研究科学家,从事深度强化学习研究,并在 NeurIPS 2021 上获得过最佳论文奖,再往前,他在 2018 年初曾在 Waymo 实习。
对于 Rishabh 来说,离职宣言里的那句「去承担一种不同类型的风险」,或许是真心话。
凭借在 Google、meta 等公司手里攒下的履历和影响力,已经足够支撑他转身去追求更自由的研究或者更大的舞台。