当前位置: 首页 » 资讯 » 新科技 » 正文

不读博士,照样进OpenAI!o1核心成员现身说法了

IP属地 中国·北京 编辑:李娜 量子位 时间:2026-01-25 14:09:20

henry 发自 凹非寺

量子位 | 公众号 QbitAI

如果没有PhD,是不是就和前沿AI研究没关系了?

至少在Noam Brown看来,未必。

这位OpenAI 研究员、o1的核心贡献者,刚刚分享了一串“非典型研究员”的经历。

有人没有论文、有人没读研、有人白天在麦肯锡上班,晚上在GitHub写研究。

还有人没事就在推特发帖、GitHub上提问的。

他们后来都去了哪?

OpenAI、DeepMind、Anthropic。

进OpenAI,并不一定要博士学位

在这篇长帖中,Noam分享了Keller JordanSholto DouglasAndy JonesKevin Wang等一批“非典型”研究员的经历。

总体看下来,他们都有一些相同的特质。比如,主动性极强(热爱)、公开研究,不闭门造车、工程能力在线、会PR、不执着于头衔。

接下来,我们具体来看。

Keller Jordan:套瓷研究+推特学术

首先被Noam分享的,是Keller Jordan

他现在在OpenAI,从事预训练相关的研究。而他的研究生涯,某种程度上,起于一段典型的“套瓷研究”。

Keller只有本科学位(UCSD),也没有任何论文发表经历。

毕业后,他先进入了一家做 AI 内容审核的初创公司工作。

在工作之余,他并没有闲着。

Keller主动联系了当时还在谷歌的Behnam Neyshabur,并向他展示了一个针对Behnam最近论文的改进想法。

或许是出于“有人真的认真读了我论文”的成就感,Behnam同意指导他。

最终,他们与其他作者一起,完成了一篇入选ICLR 2023的论文。

对于Keller这种“套瓷+研究”的方式,Noam评价说:

遗憾的是,如今公开研究的空间比以前小了,但在已有论文基础上提出改进,依然是向实验室内部研究员证明你能力的绝佳方式,也能让对方有信心去帮你争取一次面试机会。

后来,一篇2024年底写下的一篇博客Muon: An optimizer for hidden layers in neural networks,则真正为Keller拿下了一张去OpenAI的船票。

(注:Muon是专门用于神经网络隐藏层的优化器,核心思想是把常规梯度更新“正交化”)

当时,Keller发起并持续更新了一个NanoGPT speedrun:

这个实验是在Karpathy的NanoGPT框架下,系统性地比较不同训练配置和优化器,目标是把预训练速度推到极限。

而Keller自己倒腾出的Muon,正是在这一系列speedrun实验中,脱颖而出。

这引起了大神Andrej Karpathy的关注,Keller也因此进入了OpenAI的视野。

而后续进入OpenAI也是顺手推舟。

这种把研究直接摊在GitHub 上、同时在社交媒体上持续记录的方式,一方面让他的研究水平和产出变得异常容易衡量;

另一方面,也让这些工作没有淹没在arXiv的论文海里,而是被真正看见,并最终得到了圈内大神的认可。

说到底,PR太重要了!

Sholto Douglas:在GitHub上提问吸引大佬注意力

接下来,Noam又分享了现Anthropic研究员Sholto Douglas的故事。

Sholto Douglas曾经就职于谷歌,是Gemini项目的重要推手之一。

而他,也只有本科学位。

(没错,他还在清华交换了一年)

Sholto本科学的虽然是机器人,但毕业后却进了麦肯锡工作。

而这,很大的一部分原因是,Sholto没有申请到想去的研究生项目。

由此,Sholto索性干脆一边上班,一边做研究。据Sholto在播客中的分享,他几乎是:

每天晚上10点到凌晨2点,周末每天至少6到8个小时,全都在写代码、做实验、搞研究项目。

在学习过程中,Sholto还经常在Google开源的机器学习框架JAX的官方GitHub仓库上提问。

而这,引起了当时在谷歌,现在在Anthropic的James Bradbury的兴趣。

James心想:这世界上还有我不认识的隔这提问的人?

于是,在看到了Sholto的提问以及他平时做的项目,James就主动联系他,并邀请他前往Google DeepMind的面试。

最终,本科生,第一段工作完全不AI的Sholto进入了谷歌。

有趣的是,在进入谷歌之后,Sholto才发现,自己被招进来,其实在某种程度上是一个内部实验

试试看,能不能把一个热情和主观能动性极强的人,和他们认识的最优秀的一批工程师配对,看看会发生什么。

andy jones:自学软件工程和机器学习,自费发论文

andy jones现在是Anthropic的研究员,负责的RL基础设施、沙箱系统,牵头多模态方向,以及参与大模型训练。

在此之前,他是一位半退休的量化分析师。

和上面几位一样,andy有极强的主动性:他自费租赁算力,自费发表论文

在论文《Scaling Scaling Laws with Board Games》中,andy不仅首次系统地量化train与test compute的tradeoff。

还在测试时计算扩展成为热门概念之前,比较了扩展预训练和扩展测试时计算的影响。

这篇论文直接让他成为机器学习领域的炸子鸡。

而后来,这一研究还直接推动了o1等模型的测试时计算范式,并被Noam放入了o1的技术报告里。

而据一位网友的补充,andy的经历并不止如此。

他在英国完成了4年制的数学硕士,并且花9个月时间自学了软件工程和机器学习。

后来,他又干了一年的生物信息学研究。

再后来,3年的量化交易工作已足以让他财富自由。

尽管如此,andy并没有停下,而是完成了一系列独立探索,并最终进入Anthropic。

Kevin Wang:进入OpenAI的本科生

此外,Noam透露,像OpenAI这样的实验室,确实会直接从本科阶段招聘研究员。

Kevin Wang就是其中一。

2025年,Kevin Wang在完成本科学习后,直接进入OpenAI,从本科生一步跨入一线研究团队。

这并不是一次“破格的运气”。

一方面,Wang拥有导师的强力推荐;但更关键的是,他本身就握着一篇极其扎眼的论文。

对于OpenAI来说,顶会上“水平还不错”的论文并不稀缺。

真正稀缺的,是那种在第一眼就能被挑出来的工作。

Noam回忆,在NeurIPS 2025的5290篇论文中,他们几乎是一眼就注意到了Wang的研究。

而后来的结果,也验证了这个判断——

他的第一作者论文《1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities》,最终拿下了NeurIPS 2025最佳论文

谈到招聘标准时,Noam 也给出了一个很现实的评价:

导师的推荐分量很重。因为仅凭简历,甚至只看论文,本身就很难全面评估一名研究员的真实水平。

最后,Noam也分享了自己对“薪酬”的看法:

关于“薪酬”这件事:我认识一些人做量化是为了赚钱,但五年之后却开始反问自己——我到底在用人生干什么?

我们正处在一个非常特殊的历史时刻。做AI研究,你既有机会积极参与并引导这个时代最重要的技术发展,同时收入也相当可观。

我本科毕业后在量化交易行业干了一年,但并不希望自己此生对人类的“贡献”,只是让股票市场稍微更有效率一点。

后来我选择降薪转去做 AI 研究——这是我这辈子做过最好的决定。放在今天,你甚至不需要降薪,也能走上这条路。

早进厂,没啥问题

除了Noam的分享以外,现在可能越来越明显的一点是:

想把研究做好、想进前沿AI大厂,博士学位本身,似乎已经不再是必需品了。

比如,GPT论文的一作、CLIP的一作Alec Radford,就是本科出身。

而现在OpenAI的首席研究员Mark Chen,也只有本科学历,一开始做的甚至还是量化交易。

在 Noam 那条帖子下面,有网友一针见血地总结过:

一条很棒的长帖,讲的是没有PhD学位的人,是如何进入前沿AI实验室做研究的。

PhD能给你导师和同行圈子,但它并不会自动赋予你好奇心、主动性,或者研究品味。

上面提到的Keller就是一个典型例子。

他是在完全公开的环境里做出了Muon优化器,实验过程、结果都直接发在推特上。

甚至没有论文,只有一篇博客。

但影响力不言自明——现在OpenAI、Kimi、DeepSeek都在使用它。

类似的故事并不少见。

比如Stability AI的80名研究员和工程师中,只有16位拥有PhD,而且其中相当一部分是直接从推特上招来的。

换句话说,你不需要 PhD,才能成为一名优秀的研究员或工程师。

你只需要真的去做事,而且让别人看得见你在做什么。

前几天刚上《WhyNotTV》的嘉宾——

从GPT-3.5到GPT-5都有深度参与、负责GPT post-training RL infrastructure的核心成员翁家翌,也是只有硕士学位。

在播客里他也提到:相比去读一个 PhD,尽早进入工业界比较好

因为等PhD读完,研究范式可能已经换了一轮;

而且博士阶段往往面对的是toy benchmark,而不是真实世界的系统和约束。

与此同时,很多AI Lab真正短缺的,反而是工程能力极强的人

至于能不能进、进了之后做什么,很大程度上取决于:实验室当下需要什么,以及你是否已经在过往经历中证明过自己能补上那块拼图。

标签: 研究员 论文 经历 机器 导师 系统 项目 框架 能力 核心成员 网友 心想 典型 全都 进厂 年制 积极参与 过程 博士 技术 现身说法 评价 时代 自学 证明 记录 博客 非典型 方式 模态 毕业

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。