当前位置：首页 » 资讯 » 新科技 » 正文

马斯克掀桌复活Dojo 3！AI5性能暴涨50倍，1/10成本把老黄逼入死角

IP属地中国·北京 新智元 时间：2026-01-23 12:34:40

新智元报道
编辑：好困桃子
刚刚，马斯克向英伟达宣战！AI芯片9个月一更，Dojo 3涅槃重生，强攻英伟达5万亿帝国。
马斯克重磅官宣：AI5芯片步入正轨，Dojo 3项目正式重启！

对于特斯拉而言，AI5这颗芯片不仅仅是一次硬件升级，它直接「关系生死」。
这种紧迫感体现在投入的力度上——
不仅两个主力团队全押注在AI5上，就连马斯克本人也亲自下场，连续数月每周六与团队一同攻坚。
最终，AI5芯片性能极具杀伤力：
性能对标：单颗SoC直接对标英伟达Hopper，若是双芯组合相当于Blackwell；
成本优势：成本不到Blackwell十分之一；
能效碾压：能效比高出Blackwell约3倍。

就在几天前，马斯克宣布了全球首个1GW超算Colossus 2正式上线。
狂堆55万块GPU，清一色采用英伟达GB200和GB300。

未来，Dojo 3和AI5的成功，或将成为特斯拉摆脱GPU依赖的「大杀器」，彻底在AI领域站稳脚跟。

向英伟达AMD宣战
特斯拉AI芯片9个月一更
在去年的特斯拉股东大会上，马斯克在台上，首次揭秘了自研芯片的神秘面纱。
AI系列芯片本质上不是「通用芯片」，是专为自家AI软件栈深度优化的芯片。
正是这种专用性，赋予了特斯拉挑战物理定律的底气。
为了追赶AMD、英伟达，马斯克更是立下军令状：将芯片迭代节奏，拉升至约每9个月一个设计周期。

为何能做到如此神速的迭代？最关键的是，团队走的专用路线。
英伟达和AMD都需要做一个「万能」的方案，把各种需求都考虑进去，并维持一年一更的节奏。
目前，AI5芯片设计快搞定了，AI6还处于早期阶段，后续的AI7、AI8、AI9.......蓝图也已铺开。
甚至，马斯克还预言，这将在很大程度上成为世界上出货量最大的AI芯片！
AI5性能狂飙50倍
三星和台积电，是AI5的主要代工厂。他们将生产版本不同AI5，前者2nm，后者采用的是3nm工艺。
相较于上一代AI4，关于AI5更多性能表现，主要有以下几点：
总性能提升50倍，内存多9倍，原始算力提升10倍，加固的块量化与Softmax提升5倍。

它是由特斯拉软硬件团队协同设计，面向最优推理，摒弃了GPU、图像信号处理器（ISP）等传统组件。
AI5每瓦效率，要比英伟达Blackwell芯片高2-3倍，成本约为其10%。
在马斯克的战略版图中，每一代AI芯片，都有独特的「使命」——
AI4：就能让自动驾驶的安全性远超人类；
AI5：让汽车性能趋近完美，同时大幅增强Optimus的能力；
AI6：专攻Optimus进化和数据中心算力；
AI7/Dojo3：目标星辰大海，成为部署在太空的算力基座。

杀死Dojo 2，重启Dojo 3
提及特斯拉AI芯片，Dojo项目，外界曾一度认为已陷入停滞。
毕竟，上一代芯片AI4真正上车交付，至今已过去三年了。2023年初，特斯拉开始交付搭载HW4.0硬件的Model S/X，这是AI4的首次亮相。
短短一年时间，AI4不仅成为汽车的大脑，还被用在了超算的建设中。
马斯克曾透露，自家AI训练系统中，不仅使用了英伟达GPU，还使用了AI4，比例大约是1:2。
这意味着，大约有9万个H100，加上大约4万个AI4计算机。

相比之下，2021年首次官宣的Dojo超算，更是命运多舛。六年过去了，依旧停留在Dojo 1上迟迟未取得进展。
它基于特斯拉自研D1芯片构建，于2023年7月开始投产，随后在Palo Alto正式部署。

Dojo 1超算
从Dojo诞生之日起，它便专注于解决带宽瓶颈（7nm），最终为了摆脱英伟达的依赖。
然而Dojo 1之后，在很长一段时间里，Dojo 2都处于「只闻其身」的状态，最终被证实为一条「死路」。
原本传闻中，Dojo 2采用台积电5nm制程，性能将得到大幅提升。
谁曾想，去年8月，马斯克一条帖子，直接给Dojo 2判了「死刑」。

死因何在？
根本原因在于，「双轨制」的内耗：车端用「推理芯片」（AI4/HW4.0）；云端用训练芯片（D1）。
特斯拉要维护两套完全不同的芯片架构，直接分散了顶尖人才的精力。
如今，这一战略内部已被重新整合。也就是，马斯克刚刚确认重启的新一代Dojo 3。
Dojo 3将不再使用独立的D系芯片架构，直接使用下一代车载推理芯片AI5，以及后续AI芯片去搭建计算集群。

统一架构下的极限压榨
然而，统一架构带来了一个棘手的新问题：节奏冲突。
马斯克想要9个月一更，但AI5首先是一颗车载芯片。
汽车工业对「冗余设计」和「安全认证」有着近乎苛刻的执念。
车载芯片必须满足ISO 26262等一系列严苛的功能安全标准。相比之下，跑在恒温机房里的数据中心芯片，其工程验证复杂度要低不少。

既然硬件迭代被「车规级安全」和「物理规律」锁死，特斯拉如何实现性能飞跃？
答案是：基于平台的增量演进。
在AI6、AI7乃至AI9的迭代中，特斯拉将复用核心基座（指令集、内存架构、安全框架），仅针对算力扩展和工艺节点迁移（Node Shrink）进行微调。
但这还不够。
既然硬件不能像英伟达那样暴力堆料，那就从数学底层改写规则。
特斯拉的「数学作弊码」
最新的专利US20260017019A1揭示了特斯拉的终极武器：混合精度桥接器（Mixed-Precision Bridge）。

在AI世界里，存在一个永恒的矛盾。
要智能（高精度）：Transformer模型依赖32位浮点数（FP32）来处理复杂的三角函数，以确保「旋转位置编码（RoPE）」的准确性（比如记住30秒前的路标）。
要省电（低精度）：车载芯片和机器人无法承受FP32的功耗。通常使用的8位整数（INT8）虽然省电，但会因精度丢失导致AI「视力模糊」。
特斯拉的解法是：只在计算的一瞬间保持精确。
1. 对数转换与预计算
工程师设计了「混合精度桥接器」，将关键位置数据转换为对数形式。对数极小的动态范围使其能完美塞进廉价的8位硬件通道。同时，系统利用预先存好的「查找表（LUT）」，省去了现场计算的算力消耗。
2. 泰勒级数与霍纳法则
当这些8位数据到达计算核心（MAC）后，芯片利用经典的泰勒级数展开和霍纳法则，通过简单的乘法和加法，瞬间将数据还原为接近32位精度的正弦/余弦值。
3. 8位进，16位出
专利中最有趣的操作是「位移技巧」：将乘累加器变成高速交织器，通过位移操作将两个8位数值粘合成一个16位输出。这意味着，在不增加任何物理线路的情况下，芯片内部有效带宽直接翻倍。
从「健忘」到「过目不忘」
这项底层数学创新，直接解决了自动驾驶中最大的挑战之一：物体恒存性（Object Permanence）。
超长记忆：以前的FSD可能会因为视线被遮挡5秒就「忘记」路标。现在的芯片利用RoPE和混合精度架构，能精准追踪30秒甚至更久之前的数据。那个被遮挡的路标，就像被钉子钉在AI的3D地图中一样纹丝不动。
内存魔法：为了承载这30秒的高清记忆，特斯拉引入了对数存储KV Cache（内存占用减半，记忆容量翻倍至 128k）和分页注意力（像操作系统管理虚拟内存一样动态分配显存）。
永不崩溃：引入「注意力汇点（Attention Sink）」，强制保留序列开始的关键Token，确保机器人即使连续工作8小时，神经网络也不会因计算漂移而「崩溃」。
当对手富可敌国
特斯拉为何要被逼着在8位芯片上跑出32位的精度？为何要重新设计整套数学逻辑？
看看它的对手——英伟达，你就会明白「战略独立」的含金量。

第四大「经济体」的压迫感
英伟达已经不再仅仅是一家公司，从体量上看，它更像是一个超级大国——
它不仅是史上第一家、也是唯一一家市值突破过 5万亿美元大关的公司。
如果我们将这一市值放入国际货币基金组织（IMF）的国家GDP排名中，英伟达将超越日本、印度和英国，直接坐上世界第四大经济体的交椅——仅次于美国、中国和德国。
尽管将公司的市值（存量财富）与国家的GDP（年度产出）直接对比并非完全精准的经济学算法，但这种视觉冲击力足以说明问题：在AI时代，算力即国力。
拓展阅读：英伟达，全球首个5万亿美元公司诞生！「GPU帝国」超日本德国GDP

比总量更可怕的是效率。
英伟达创造这一富可敌国的估值，仅依靠了3.6万名员工。作为对比，被其超越的日本GDP，是由1.24亿人口辛勤劳作支撑起来的庞大经济机器。
这意味着，在AI革命的浪潮尖端，一个人才加上正确的算力杠杆，其创造的资本价值可以是传统工业社会模式的数千倍。
护城河的延伸
是什么支撑了这5万亿的帝国？
除了黄仁勋口中「销量好到爆表」的Blackwell芯片和早已售罄的云端GPU产能，英伟达的野心正在向特斯拉的腹地延伸。
硬件只是入场券：英伟达真正的底牌是CUDA生态。正如沃伦·巴菲特所言，这构成了极宽的「护城河」。它通过极其粘性的软件环境锁死了开发者，让任何试图迁移到其他芯片（包括特斯拉试图做的）的成本变得极高。
物理AI的新战场：英伟达不再满足于让AI在屏幕里聊天，它正在大举进军「物理AI」——即机器人、自动化和工业系统。
正是在这样一个由5万亿巨头统治、且入场费极其昂贵的「物理AI」赛道上，特斯拉的那种「在8位芯片上跑出32位精度」的突破，才显得尤为关键。
而Dojo 3与AI5的组合，就是特斯拉在这场不对称战争中，打出的最强反击。
参考资料：
https://x.com/Teslaconomics/status/2013047446348431385
https://x.com/elonmusk/status/2013108912380326218
https://www.tomshardware.com/tech-industry/artificial-intelligence/elon-musk-reveals-roadmap-with-nine-month-cadence-for-new-ai-processor-releases-beating-nvidia-and-amds-yearly-cadence-musk-plans-to-have-the-highest-volume-chips-in-the-world

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

刚刚！捷龙三号遥十运载火箭海上发射圆满成功

高品质音频离不开的芯片！傅里叶半导体通过聆讯，募资加码智能汽车领域|港E声

海上捷龙十问苍穹 | 一图纵览“捷龙三号”运载火箭的太空征途

高品质音频离不开的芯片！傅里叶半导体通过聆讯，募资加码智能汽车领域|港E声

我国成功发射微厘空间02组卫星

星际荣耀双曲线三号可重复使用运载火箭一级辅助动力系统试车成功

全站最新

刚刚！捷龙三号遥十运载火箭海上发射圆满成功

高品质音频离不开的芯片！傅里叶半导体通过聆讯，募资加码智能汽车领域|港E声

海上捷龙十问苍穹 | 一图纵览“捷龙三号”运载火箭的太空征途

高品质音频离不开的芯片！傅里叶半导体通过聆讯，募资加码智能汽车领域|港E声

热门推荐

刚刚！捷龙三号遥十运载火箭海上发射圆满成功

行业首个！滴滴，放大招！打车进入“一句话时代”？

高品质音频离不开的芯片！傅里叶半导体通过聆讯，募资加码智能汽车领域|港E声

海上捷龙十问苍穹 | 一图纵览“捷龙三号”运载火箭的太空征途

高品质音频离不开的芯片！傅里叶半导体通过聆讯，募资加码智能汽车领域|港E声

我国成功发射微厘空间02组卫星

我国成功发射微厘空间02组卫星

星际荣耀双曲线三号可重复使用运载火箭一级辅助动力系统试车成功

扩散语言模型总是均匀发力，华为诺亚教它「抓重点」

马斯克旗下xAI加码企业服务赛道，贴身策略争夺AI商业客户

蔡崇信：AI终极目标是造福社会，阿里唯一的方向就是不断创新

星际荣耀双曲线三号可重复使用运载火箭一级辅助动力系统试车成功

AI双引擎驱动载板黄金周期：ABF迎56%复合增长，BT乘存储复苏东风

“李鬼”退场，外泌体“李逵”要来改变你的生活了｜对话清华科学家尹航

全球“芯荒”推升消费电子价格