当前位置: 首页 » 资讯 » 新科技 » 正文

在GTC谈基座模型,元戎启行把自己放进了物理AI牌桌

IP属地 中国·北京 钛媒体APP 时间:2026-03-19 08:44:22


图片系AI 生成

英伟达GTC大会再次把“物理AI”推到了台前。

3月17日,英伟达GTC 2026在美国举行,和往年相比,这届GTC对外释放的信号更直接:英伟达已经不满足于把AI停留在数字世界,而是把“Physical AI”推到了舞台中央。

官方议程把 physical AI 与 agentic AI、AI factories 并列为大会主线;黄仁勋在相关发布中也把重点放在机器人、仿真、世界模型和开放数据工厂上,试图把“会算”的AI,进一步推进到“会感知、会判断、会行动”的AI。

在这个背景下,元戎启行CTO曹通易在GTC上介绍了Foundation Model(基座模型)为核心重构的辅助驾驶技术体系。 这家公司试图把辅助驾驶从一个单点产品,重新定义为物理世界AI的一种落地形态。换句话说,车不再只是终点,而是起点。

1、汽车只是物理AI的一部分

英伟达这次发布的新内容里,既有面向机器人和工业场景的 Isaac 仿真框架、GR00T 模型,也有面向 physical AI 训练的数据工厂蓝图;官方甚至明确提到,这套体系将用于机器人、视觉AI代理和自动驾驶开发。

这背后其实是一个比较明显的产业判断:过去几年,AI主要解决的是“理解文本、生成内容、辅助决策”的问题;接下来要解决的,是如何让系统进入现实空间,在复杂环境里感知、推理、行动,并且承担结果。

对汽车行业来说,这件事并不抽象。辅助驾驶本质上就是最早、最成熟、也是最严苛的 physical AI 试验场之一。因为车每天都在真实道路中运行,场景开放、变量密集、容错极低,远比很多封闭环境里的机器人更难。

所以,元戎启行选择在GTC这个时间点,把自己的技术体系和“物理世界AI基座”绑定,并不是在追热点,而是在顺着英伟达定义的新叙事往前走。问题不在于它会不会讲故事,而在于这个故事有没有产业基础。

2、不是辅助驾驶功能,而是“统一大脑”

按照曹通易在GTC上的表述,元戎启行正在用 Foundation Model 重构下一代辅助驾驶技术体系,并将其定义为面向物理世界的AI基座模型。公开信息显示,这套系统以 400 亿参数规模的 VLA(视觉—语言—动作)基座模型为核心,试图把场景理解、驾驶决策和安全评估统一到同一套模型架构里,而不是像过去那样,把感知、规划、控制拆成多个相互耦合但并不真正统一的模块。

这件事为什么重要?因为过去一代辅助驾驶系统最大的问题,不是功能做不出来,而是系统天然是“拼接式”的。看见是一个模块,理解是一个模块,决策又是一个模块,最后靠规则、工程经验和大量人工调参,把它们尽量焊在一起。

这种架构在高速和标准化道路上还能工作,一旦进入城市、施工、混行、博弈密集的复杂场景,就容易出现两个老问题:第一,系统知道“看到了什么”,但不一定真正理解发生了什么;第二,系统能完成动作,但不一定让用户敢持续使用。

元戎启行现在想做的,是把“驾驶员”、“分析师”、“裁判员”三种能力塞进同一个基础模型里。说白了,就是让系统不只是执行,而是先形成对物理场景的统一理解,再输出动作。这种路径和行业过去的“规则+模块堆叠”相比,核心变化不在架构逻辑:它希望系统先长出一个统一认知,再去调用不同能力,而不是让不同能力各干各的。

这也是为什么曹通易会把辅助驾驶称为基座模型的第一个“身体”。这句话听上去很像技术圈常见的大词,但放到产业逻辑里并不难理解:今天先让模型在车上学会感知道路、处理风险、完成动作,明天同样的认知底座,就有可能迁移到 Robotaxi,甚至更广义的具身智能系统。

3、为什么是汽车先跑出来?

如果只把这套逻辑当成概念包装,其实会低估它。元戎启行这次最现实的一点,是它给终局找到了一条当前可走的路径:先从量产车开始,把真实世界的数据、反馈和训练闭环做出来。

公开报道显示,搭载元戎启行方案的量产车累计交付已超过25万辆;公司方面同时强调,这些车辆在复杂道路中的场景理解能力,可以迁移到 Robotaxi 研发中。其面向量产辅助驾驶的数据闭环周期已压缩到12小时。无论这些数字最终效果如何,至少说明一件事:它不是先去做人形机器人,再倒推通用模型,而是先在车这个高频、高风险、高反馈密度的场景里,把模型打磨出来。

这条路径的现实性,恰恰在于汽车行业的特殊性。车是少数已经具备规模化硬件载体、持续在线运行环境、海量真实场景数据,以及明确安全边界要求的行业。

换句话说,汽车很可能是离物理AI最近的训练场。英伟达对 physical AI 的最新布局里,也一再把自动驾驶和机器人并列:从 Cosmos 世界模型,到开放数据工厂蓝图,再到面向自动驾驶长尾场景的开放模型家族,底层思路都指向同一个方向——用更统一的世界建模和仿真能力,处理真实世界里最昂贵的长尾问题。

所以,汽车行业积累的数据、算力和工程体系,不只能服务于卖车,也可能反过来成为物理AI时代最先成型的一块底座,因为车是最贵也最有效的数据源。

4、是中国智驾公司开始抢解释权

当然,这条路线还远没到可以下结论的时候。Foundation Model 能不能真正解决辅助驾驶里的安全一致性、责任边界和长尾稳定性,最终还要看量产表现,而不是技术演讲。尤其在智能驾驶领域,所有宏大叙事最后都要落到一个最朴素的问题上:用户敢不敢开,车企敢不敢上,监管敢不敢放。

但从行业竞争的角度看,元戎启行在GTC释放这个信号,仍然值得重视。因为过去两年,汽车AI的主导叙事,基本掌握在特斯拉、英伟达这样的平台型巨头手里。中国智驾公司更多是在做应用落地、性能追赶和成本优化,很少有人试图从“底层范式”层面重新定义自己。

元戎启行这次的动作,本质上是在争夺一个新的解释权:它不满足于被理解成一家辅助驾驶供应商,而是试图把自己放进物理AI的更大坐标系里。

这件事能不能成功,现在还言之过早。但有一点已经越来越清楚:辅助驾驶行业正在进入一个新阶段。过去比的是有没有功能、有没有地图、能不能开;接下来比的,是谁能先做出一个足够统一、足够可迁移、足够能在真实世界里持续学习的“大脑”,只有这个才能拉开差距。(作者|李玉鹏,编辑|李程程)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新