![]()
智东西
编译 王欣逸
编辑 程茜
智东西12月30日消息,今天,AI学术大牛、斯坦福大学教授、谷歌大脑联合创始人吴恩达在社交媒体平台发布公开信和一篇长文,称2025年或将作为AI工业时代的黎明,并总结了今年AI发展的四大关键词:模型的推理能力、AI人才争夺战、巨大规模的AI基建以及编程Agent的普及。
在公开信中,吴恩达分享了关于掌握AI系统构建能力的三步法:系统学习AI课程、动手实践构建项目和阅读前沿研究论文。
![]()
关于模型的推理能力,吴恩达提到,它已成为大多数新一代模型的内置常规能力,能显著提升模型在各种任务上的表现,而这一能力,在2025年初还需通过特别提示来触发。
今年7月,由meta首先引爆的AI人才争夺战将AI人才的市场价值推向前所未有的高度。AI数据标注公司Scale AI的首席执行官汪滔(Alexandr Wang)及其核心团队、苹果AI研发团队负责人庞若鸣等AI大牛加盟meta,在这场人才混战中,微软AI CEO穆斯塔法·苏莱曼(Mustafa Suleyman)挖走谷歌20多名研究员和工程师,特斯拉首席执行官埃隆·马斯克(Elon Musk)也为xAI挖走meta的10余名工程师。
在AI基础设施上,吴恩达认为,2025年可能正是一个以AI基础设施为核心的新工业时代的开端,代表项目有OpenAI、甲骨文和软银联合推进的“星际之门”项目、meta的“Hyperion”项目。
全球知名咨询公司贝恩公司估计,2030年AI行业年收入需达到2万亿美元(约合人民币13.98万亿元)才能支撑这些AI基建投入,而这一数据将超过亚马逊、苹果、Alphabet、微软、meta和英伟达2024年的收益总和。
在编程Agent的发展上,吴恩达认为,无需担心AI将取代初级开发者,AI辅助编程很快可能就被简单地视为编程本身,类似拼写检查和自动补全是写作的一部分,而擅长使用AI的开发者的开发效率和质量将远胜以往。
以下为吴恩达的信和年度AI总结特刊全文编译(为优化阅读体验,智东西做了不改变原意的编辑):
亲爱的朋友们:
又一年AI技术的飞速进步,为每个人创造了前所未有的软件开发机遇,包括刚刚踏入这个领域的人。现实情况是,如今很多公司都难以招到足够多的熟练AI人才。每年冬天,我都会抽出时间学习和做些项目,也希望你能一起。这不仅能帮我巩固旧技能、掌握新本领,也能为你的科技职业道路增添助力。
想真正掌握构建AI系统的能力,我的建议是:
1、系统学习AI课程
2、动手实践构建项目
3、(可选)阅读前沿研究论文
下面我会具体说说为什么这三条缺一不可。
我注意到,有些开发者会建议新人“直接开干,别管学习”。这其实是个非常糟糕的建议!除非你本身就处在一个经验丰富的AI开发者社群里,能随时获得指导,否则在缺乏基础知识的情况下直接动手,很可能意味着你会重复发明轮子,而且更可能的是,费力造出一个更差的轮子。
举个例子,我在面试中遇到过一些开发者,他们曾耗费大量时间“重新发明”了标准的RAG文档分块方案,重复实现了已有的Agent评估方法,或是写出了难以维护的大模型上下文管理代码。如果他们事先学过几门相关的课程,就能更好地理解那些现成的、成熟的模块。他们当然依然可以选择从头搭建(甚至可能造出更好的),但这本可以避免他们数周不必要的重复劳动。
所以,系统的结构化学习很重要,更何况,我发现学习课程本身也充满乐趣。比起刷剧,我更愿意每天听一场资深AI讲师的精彩课程。
与此同时,仅仅上课是不够的。有很多经验教训,只有通过动手实践才能获得。学习飞机的工作原理对成为飞行员至关重要,但没人能只靠上课就学会驾驶。关键的一步,是真正坐进驾驶舱。 好消息是,借助如今高度智能化的Agent编程,实际构建的过程已变得前所未有的便捷。同时,系统学习AI的构成模块,也常能点燃你创作新项目的灵感。每当我缺乏项目灵感时,通常会选择去上课或读几篇论文,这样做一段时间之后,新想法总会源源不断地涌现。更重要的是,动手构建本身充满乐趣,我希望你也能亲身感受到这份快乐。
最后,不是每个人都必须这样做,但我观察到,当今就业市场上最具竞争力的候选人大多保持着偶尔阅读论文的习惯。虽然我发现研究论文比课程难消化得多,但它包含着大量尚未被简化普及的前沿知识。我将它的优先级置于系统学习和实践构建之后,但如果你有机会提升阅读论文的能力,我强烈建议你去尝试(你也可以参考我早年关于如何读论文的建议视频)。对我来说,学习和构建充满趣味,而读论文有时则像“苦差”,但从阅读论文中获得的灵光一闪是令人愉悦的。
祝你有一个美好的冬日假期,新年快乐!除了学习和构建,我也希望你能花时间与所爱之人共度,那同样重要!
此致
安德鲁
以下为吴恩达发布在《The Batch》上的年度AI总结特刊,标题为《2025年顶级AI新闻(Top AI Stories of 2025)》。
2025年或将作为AI工业时代的黎明。创新驱动模型性能迈上新台阶,AI应用正变得无处不在、不可或缺,顶尖企业为争夺人才激烈角逐,大规模基础设施建设也拉动了美国经济增长。与过去的冬季假日季一样,本期《The Batch》特刊梳理了过去一年的核心脉络。随着AI更深地融入社会生活的方方面面,新的一年将有望进一步巩固这些变革的根基。
一、思考模型:解决更复杂的问题
一步一步思考、解释你的推理、从答案倒推,这些策略在2025年初还需通过特别提示来触发,而如今,它们已成为大多数新一代大型语言模型的内置常规能力,显著提升了模型在各种任务上的表现。
(1)发生了什么:
这一变革始于2023年底OpenAI推出首个具备自主推理工作流的“思考”模型o1。随后,DeepSeek-R1于2024年1月展示了构建此类模型的可行路径。其直接成果是:数学与编程能力大幅跃升,问答准确性提高,机器人更加智能,AI Agent也发展迅猛。
(2)发展脉络:
此类模型能力的源头可追溯到论文《大模型是零样本推理者(Large Language Models Are Zero-Shot Reasoners)》,其中提出的“让我们一步一步地思考”提示词,能显著改善模型输出。研究人员很快意识到,可通过训练将这种推理策略内化。关键方法在于强化学习微调:通过奖励模型产生正确答案,从而让其在输出前进行深度“思考”。
1、最初的几个推理模型专门通过RL进行训练,以正确解决数学问题、准确回答科学问题和完成代码生成任务,成绩斐然。例如,o1-preview在AIME 2024数学竞赛上的表现较GPT-4o提升43个百分点,在博士级科学考试GPQA Diamond上提升22个百分点,其编程能力在Codeforces平台上可位列人类程序员的前62%,远超GPT-4o的11%。
2、当推理模型学会调用计算器、搜索引擎等外部工具时,能力进一步增强。例如,配备工具后,OpenAI o4-mini在一项涵盖100个领域的多模态专业测试中,准确率提升了3个百分点以上。
3、机器人行动模型(Robotic action models)已通过RL训练进行推理。例如,与像OpenVLA这样的非思考模型相比,ThinkAct模型通过推理在任务中获得了约8%的性能提升。
4、同时,它助力AI Agent解决复杂问题。例如,AlphaEvolve使用Google Gemini反复生成、评估和修改代码,最终为现实世界问题生成更快的算法。同样,AI Co-Scientist使用Gemini生成科学研究提案,然后审查、排名并改进它们,其中一项关于抗生素耐药性的假设竟与人类科学家同期独立提出的想法不谋而合。
(3)潜在局限:
然而,推理模型可能并不像看起来那样理性。
苹果公司的一项研究指出,即使给模型提供了能解决难题的算法,推理模型也无法解决超出一定复杂度的谜题。模型应用算法的能力不足,对机器推理与人类推理之间的表面相似性提出了质疑。
Anthropic的研究发现,虽然模型的推理步骤有助于解释它如何得出结论,但这些步骤也可能省略了促成结论的关键信息。例如,可以在提示中加入暗示来引导推理模型产生特定输出,但这些暗示可能不会在其推理步骤中体现。
(4)现状:
推理显著提升了大模型性能。然而,更好的输出是有代价的。启用了推理的Gemini 3 Flash使用了1.6亿个Token来运行Artificial Analysis Intelligence Index的基准测试(并获得了71分),而未启用推理的Gemini 3 Flash使用了740万个Token(获得了低得多的55分)。此外,启用推理也导致了生成延迟,增加了对模型推理服务商更快提供Tokens的压力。研究人员正在寻找方法优化效率。Claude Opus 4.5和设置为高推理模式的GPT-5.1获得了相同的性能分数,但前者使用了4800万个Tokens,后者则使用了8100万个Tokens。
二、大型AI公司的高薪人才争夺战
科技巨头间爆发了一场激烈的人才争夺战,为吸引顶尖人才,它们开出了堪比职业体育明星的天价薪酬。
(1)发生了什么:
2025年7月,meta启动了一场招聘狂潮,为新成立的meta超级智能实验室(MSL)储备人才,向来自OpenAI、谷歌、Anthropic等顶级公司的研究员开出了高达数亿美元的薪酬方案,其中包括巨额现金奖金以及为补偿其放弃原公司股权而设立的奖励。作为反击,meta的竞争对手们也纷纷从meta及其他公司挖走关键员工,将AI人才的市场价值推至前所未有的高度。
(2)背后推手:
meta以价值高达3亿美元(约合人民币20.97亿元)、为期四年的薪酬方案颠覆了行业惯例,其流动现金补偿远超其他公司需要多年才能归属的股票期权。据《华尔街日报》报道,在成功招揽Scale AI的首席执行官汪滔(Alexandr Wang)及其核心团队后,meta首席执行官马克·扎克伯格(Mark Zuckerberg)亲自拟定了一份“愿望清单”并展开攻势:
扎克伯格登门拜访,说服目标人选跳槽,有时还会带上自制的汤。此举成功招募了包括OpenAI推理模型研究员韦杰森(Jason Wei)和郑亨元(Hyung Won Chung)在内的多位顶尖人才。
据《华尔街日报》报道,与OpenAI前CTO 米拉·穆拉蒂(Mira Murati)共同创立Thinking Machines Lab的安德鲁·塔罗克(Andrew Tulloch),最初拒绝了meta一份包含15亿美元(约合人民币104.84亿元)奖金的邀约,但数月后仍选择加入。
meta雇佣了曾在苹果公司负责AI模型的庞若鸣(Ruoming Pang)。彭博社报道,这份多年期的薪酬方案价值数亿美元。该报价超过了苹果除首席执行官外的最高管理层薪酬,而苹果公司拒绝提出还价。
在这场混战中,微软AI CEO穆斯塔法·苏莱曼(Mustafa Suleyman)从谷歌带走了20多名研究员和工程师,其中包括工程副总裁阿马尔·苏布拉马尼(Amar Subramanya)。
埃隆·马斯克的xAI则从meta挖走十余名AI研究员与工程师。马斯克批评竞争对手的报价“疯狂”,并吹捧自己公司“高度精英”的文化以及股权更大的增长潜力。
(3)背景信息:
AI工程师薪酬的演变轨迹,清晰地反映了该领域从学术研究到产业核心的变迁:
2011年:谷歌大脑在吴恩达领导下成立时,AI人才主要集中于学术界。随着神经网络进入搜索引擎和AI助手等商业产品,机器学习工程师职位成为企业标准层级。
2014年,谷歌收购DeepMind时,AI薪资显著超过一般软件工程薪资。《纽约时报》估计,DeepMind的每名员工人力成本约为34.5万美元(约合人民币241.14万元)。到2017年谷歌推出Transformer架构时,顶级薪酬已升至高达50万美元(约合人民币349.48万元)。
大约在2023年,随着ChatGPT的兴起,薪酬再次跃升。据报道,顶级软件工程师的薪酬方案已超过70万美元(约合人民币489.27万元)。
(4)当前现状:
随着2026年的开始,AI招聘市场已彻底改变。《华尔街日报》报道,为留住人才,OpenAI提供了更优厚的股权激励、加速了新员工期权归属,并发放了高达150万美元(约合人民币1048.44万元)的留任奖金。尽管今年存在对“AI泡沫”的讨论,但对于计划投入数百亿美元建设数据中心的公司而言,高昂的薪酬是合理的,既然能在硬件上投入巨资,为何不在至关重要的人才资源上投入其一小部分呢?
三、数据中心建设规模巨大
全球顶级科技公司宣布了建设数据中心的计划,预计未来几年将消耗数万亿美元和数十亿瓦特的电力。
(1)发生了什么:
仅今年一年,AI行业的资本支出就超过3000亿美元(约合人民币2.10万亿元),且大部分流向了新的AI算力基础设施。这仅仅是开始,各公司正规划建设小镇规模、能源需求匹敌中型城市的巨型设施。咨询公司麦肯锡预计,为满足未来的模型训练与推理需求,到2030年,这场算力竞赛的总投入可能高达5.2万亿美元(约合人民币36.35万亿元)。
(2)背后推手:
顶级AI公司在全球范围内宣布了一系列数据中心项目,每千兆瓦数据中心容量的建设成本约需500亿美元(约合人民币3494.8亿元)。
今年一月,OpenAI联合甲骨文、软银等启动了耗资5000亿美元(约合人民币3.49万亿元)的“星际之门”项目,并计划在全球建设200亿瓦数据中心,还预测了需求可能高达这一数值的5倍。OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)甚至提出了“最终实现每周新增10亿瓦容量”的目标。
meta 2025年的基础设施投资约720亿美元(约合人民币5032.51亿元),主要位于美国,其高管表示这一数字在2026年将大幅上升。该公司标志性的“Hyperion”项目包括在路易斯安那州农村地区投资270亿美元(约合人民币1887.19亿元)、50亿瓦的数据中心。通过特殊融资安排,该项目的资产与债务未计入公司资产负债表。
微软在2025年花费了800亿美元(约合人民币5591.68亿元)用于全球数据中心项目,包括威斯康星州和亚特兰大的设施,这些设施将通过专用光纤网络连接,作为一个庞大的超级计算机运行。为了供电,该公司签署了一项为期20年的协议,重启宾夕法尼亚州的三哩岛核反应堆,该反应堆将从2028年开始提供835兆瓦的电力。公司还计划将欧洲的云与AI容量扩展至200个数据中心。
亚马逊预计2025年在基础设施上花费1250亿美元,2026年将更多。其110亿美元(约合人民币768.86亿元)的“Rainier项目”是印第安纳州的一个22亿瓦、运行在50万个Amazon Trainium 2芯片上的数据中心。此外,亚马逊计划在澳大利亚花费大约140亿美元(约合人民币978.54亿元)扩展数据中心,并在2025年至2029年间在德国投资约210亿美元(约合人民币1467.82亿元)。
谷歌母公司Alphabet预计2025年在基础设施上花费高达930亿美元(约合人民币9500.33亿元),高于此前750亿美元(约合人民币5242.2亿元)的预测。该公司宣布了一项400亿美元(约合人民币3075.42亿元)的项目,计划到2027年在德克萨斯州新增3个数据中心。它还承诺在印度投入150亿美元(约合人民币1048.44亿元)、在德国投资约60亿美元(约合人民币419.38亿元),并在澳大利亚、马来西亚和乌拉圭推出了新的或扩展的项目。
(3)现实挑战
然而,如此庞大的基建计划能否被现有经济与基础设施所承载,仍存疑虑:
贝恩公司估计,为支撑这些投资,到2030年AI行业年收入需达到2万亿美元(约合人民币13.98万亿元),这将超过亚马逊、苹果、Alphabet、微软、meta和英伟达2024年的收益总和。
此外,当前的电网可能不足以支持这些数据中心。据彭博社报道,硅谷的两个设施因当地公用事业公司没有足够的容量将其接入电网而处于闲置状态。
另据英国《金融时报》报道,十二月中旬,Blue Owl Capital曾因担忧债务问题,退出了为甲骨文和OpenAI的一个100亿美元(约合人民币698.96亿元)数据中心提供融资的谈判。报告引用了对甲骨文在数据中心建设过程中债务不断增加的担忧。Blue Owl Capital继续为其他甲骨文和OpenAI的数据中心项目提供融资。
(4)现状:
尽管存在对AI泡沫的担忧,但数据中心的建设热潮已在疲软的经济中创造了实实在在的就业与产值。哈佛经济学家杰森·弗曼(Jason Furman)称,2025年上半年美国GDP的增长几乎全部来源于对数据中心和AI的投资。有充分证据表明,2025年可能正是一个以AI基础设施为核心的新工业时代的开端。
四、编程Agent更快,还更便宜
代码生成已从简单的自动补全,演进为能够管理复杂软件开发全流程的Agent系统。
(1)发生了什么:
编程成为具有最直接商业价值的Agent工作流应用。从Claude Code、Google Gemini CLI到OpenAI Codex,编程Agent现已成为各大AI公司的关键竞争战场,较小的竞争者也不得不开发自有的Agent模型以维持竞争力。
(2)背后推手:
2024年,Agent代码生成器Devin将SWE-Bench基准的解决率从1.96%大幅提升至13.86%;到2025年,基于最新大模型的编程Agent已能解决超过80%的同类任务。开发者开始采用更复杂的Agent框架,使其能进行任务规划、自我评估、调用工具并管理整个代码库。
2024年底出现的推理模型显著提升了编程能力与性价比。Agent可利用推理能力规划任务,并将具体执行分配给成本更低的模型。引入“可变推理预算”机制后,单个模型能动态分配更多计算资源用于复杂规划,减少简单编辑的消耗。至2025年底,Gemini 3 Pro、Claude Opus 4.5和GPT-5.2成为该领域的领先模型。
与此同时,开源模型迅速跟进。Z.ai GLM-4.5和Kimi K2大幅降低了自动化编程初创公司的成本。七月发布的Qwen3-Coder拥有4800亿参数,基于超5万亿Tokens训练,性能已接近Claude Sonnet 4。
Anthropic二月推出的基于Agent框架创建的Claude Code应用获得市场成功,重新定义了Agent编程的体验标准。OpenAI以基于其GPT-5系列编程专用版本的Codex应用作为回应。Claude Code最初在本地运行,而Codex应用在浏览器中运行,这有助于推广在云端运行的Agent编程。到年底,这些Agent已经能够使用多个子Agent——通常是一个启动器来开始任务并跟踪进度,以及各种编程Agent来完成不同任务,每个都有其自己的上下文窗口,来处理运行时间更长的问题。
模型制造商与集成开发环境(IDE)供应商之间的拉锯战导致像Anysphere(Cursor母公司)和Cognition AI(Windsurf母公司)这样的流行IDE供应商建立了自己的模型。与此同时,谷歌构建了自己的IDE Antigravity,并于十一月首次亮相。
(3)背景信息:
随着Agent能力提升,传统的SWE-Bench基准已不足够,催生了SWE-Bench Verified、LiveBench、Terminal-Bench等一系列新评估标准。然而,由于各厂商倾向于引用对自己有利的基准,客观评估和工具选型反而变得更加困难。
在2025年初,大多数观察家认为Agent擅长生成常规代码、文档和单元测试,但在战略设计上有经验的人类工程师和产品经理表现得更好。到年底,情况已然改变:微软、谷歌、亚马逊和Anthropic表示,其代码库中由AI自动生成的高层级任务代码比例正在显著上升。
(4)行业现状:
在短时间内,编程Agent已将“Vibe Coding(氛围编程)”从一个令人费解的流行语推动为一个蓬勃发展的行业。像Loveable、Replit和Vercel这样的初创公司使用户几乎无需编程经验就能从头构建应用。尽管有人担忧AI将取代初级开发者,但事实表明,善用AI的开发者其原型构建效率和质量远胜以往。很快,AI辅助编程可能就被简单地视为编程本身,就像拼写检查和自动补全是写作的一部分一样。
X





京公网安备 11011402013531号