当前位置：首页 » 资讯 » 新科技 » 正文

在GTC谈基座模型，元戎启行把自己放进了物理AI牌桌

IP属地中国·北京 钛媒体APP 时间：2026-03-19 08:44:22

图片系AI 生成
英伟达GTC大会再次把“物理AI”推到了台前。
3月17日，英伟达GTC 2026在美国举行，和往年相比，这届GTC对外释放的信号更直接：英伟达已经不满足于把AI停留在数字世界，而是把“Physical AI”推到了舞台中央。
官方议程把 physical AI 与 agentic AI、AI factories 并列为大会主线；黄仁勋在相关发布中也把重点放在机器人、仿真、世界模型和开放数据工厂上，试图把“会算”的AI，进一步推进到“会感知、会判断、会行动”的AI。
在这个背景下，元戎启行CTO曹通易在GTC上介绍了Foundation Model（基座模型）为核心重构的辅助驾驶技术体系。这家公司试图把辅助驾驶从一个单点产品，重新定义为物理世界AI的一种落地形态。换句话说，车不再只是终点，而是起点。
1、汽车只是物理AI的一部分
英伟达这次发布的新内容里，既有面向机器人和工业场景的 Isaac 仿真框架、GR00T 模型，也有面向 physical AI 训练的数据工厂蓝图；官方甚至明确提到，这套体系将用于机器人、视觉AI代理和自动驾驶开发。
这背后其实是一个比较明显的产业判断：过去几年，AI主要解决的是“理解文本、生成内容、辅助决策”的问题；接下来要解决的，是如何让系统进入现实空间，在复杂环境里感知、推理、行动，并且承担结果。
对汽车行业来说，这件事并不抽象。辅助驾驶本质上就是最早、最成熟、也是最严苛的 physical AI 试验场之一。因为车每天都在真实道路中运行，场景开放、变量密集、容错极低，远比很多封闭环境里的机器人更难。
所以，元戎启行选择在GTC这个时间点，把自己的技术体系和“物理世界AI基座”绑定，并不是在追热点，而是在顺着英伟达定义的新叙事往前走。问题不在于它会不会讲故事，而在于这个故事有没有产业基础。
2、不是辅助驾驶功能，而是“统一大脑”
按照曹通易在GTC上的表述，元戎启行正在用 Foundation Model 重构下一代辅助驾驶技术体系，并将其定义为面向物理世界的AI基座模型。公开信息显示，这套系统以 400 亿参数规模的 VLA（视觉—语言—动作）基座模型为核心，试图把场景理解、驾驶决策和安全评估统一到同一套模型架构里，而不是像过去那样，把感知、规划、控制拆成多个相互耦合但并不真正统一的模块。
这件事为什么重要？因为过去一代辅助驾驶系统最大的问题，不是功能做不出来，而是系统天然是“拼接式”的。看见是一个模块，理解是一个模块，决策又是一个模块，最后靠规则、工程经验和大量人工调参，把它们尽量焊在一起。
这种架构在高速和标准化道路上还能工作，一旦进入城市、施工、混行、博弈密集的复杂场景，就容易出现两个老问题：第一，系统知道“看到了什么”，但不一定真正理解发生了什么；第二，系统能完成动作，但不一定让用户敢持续使用。
元戎启行现在想做的，是把“驾驶员”、“分析师”、“裁判员”三种能力塞进同一个基础模型里。说白了，就是让系统不只是执行，而是先形成对物理场景的统一理解，再输出动作。这种路径和行业过去的“规则+模块堆叠”相比，核心变化不在架构逻辑：它希望系统先长出一个统一认知，再去调用不同能力，而不是让不同能力各干各的。
这也是为什么曹通易会把辅助驾驶称为基座模型的第一个“身体”。这句话听上去很像技术圈常见的大词，但放到产业逻辑里并不难理解：今天先让模型在车上学会感知道路、处理风险、完成动作，明天同样的认知底座，就有可能迁移到 Robotaxi，甚至更广义的具身智能系统。
3、为什么是汽车先跑出来？
如果只把这套逻辑当成概念包装，其实会低估它。元戎启行这次最现实的一点，是它给终局找到了一条当前可走的路径：先从量产车开始，把真实世界的数据、反馈和训练闭环做出来。
公开报道显示，搭载元戎启行方案的量产车累计交付已超过25万辆；公司方面同时强调，这些车辆在复杂道路中的场景理解能力，可以迁移到 Robotaxi 研发中。其面向量产辅助驾驶的数据闭环周期已压缩到12小时。无论这些数字最终效果如何，至少说明一件事：它不是先去做人形机器人，再倒推通用模型，而是先在车这个高频、高风险、高反馈密度的场景里，把模型打磨出来。
这条路径的现实性，恰恰在于汽车行业的特殊性。车是少数已经具备规模化硬件载体、持续在线运行环境、海量真实场景数据，以及明确安全边界要求的行业。
换句话说，汽车很可能是离物理AI最近的训练场。英伟达对 physical AI 的最新布局里，也一再把自动驾驶和机器人并列：从 Cosmos 世界模型，到开放数据工厂蓝图，再到面向自动驾驶长尾场景的开放模型家族，底层思路都指向同一个方向——用更统一的世界建模和仿真能力，处理真实世界里最昂贵的长尾问题。
所以，汽车行业积累的数据、算力和工程体系，不只能服务于卖车，也可能反过来成为物理AI时代最先成型的一块底座，因为车是最贵也最有效的数据源。
4、是中国智驾公司开始抢解释权
当然，这条路线还远没到可以下结论的时候。Foundation Model 能不能真正解决辅助驾驶里的安全一致性、责任边界和长尾稳定性，最终还要看量产表现，而不是技术演讲。尤其在智能驾驶领域，所有宏大叙事最后都要落到一个最朴素的问题上：用户敢不敢开，车企敢不敢上，监管敢不敢放。
但从行业竞争的角度看，元戎启行在GTC释放这个信号，仍然值得重视。因为过去两年，汽车AI的主导叙事，基本掌握在特斯拉、英伟达这样的平台型巨头手里。中国智驾公司更多是在做应用落地、性能追赶和成本优化，很少有人试图从“底层范式”层面重新定义自己。
元戎启行这次的动作，本质上是在争夺一个新的解释权：它不满足于被理解成一家辅助驾驶供应商，而是试图把自己放进物理AI的更大坐标系里。
这件事能不能成功，现在还言之过早。但有一点已经越来越清楚：辅助驾驶行业正在进入一个新阶段。过去比的是有没有功能、有没有地图、能不能开；接下来比的，是谁能先做出一个足够统一、足够可迁移、足够能在真实世界里持续学习的“大脑”，只有这个才能拉开差距。（作者｜李玉鹏，编辑｜李程程）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

2000万只“龙虾”进入企业，阿里的新企业Agent故事 | 最前线

第四届微信小程序全球创新挑战赛在香港启动

腾讯云安全团队腾讯研究院安全研究中心：腾讯云安全白皮书

97年女生！字节Seed研究员曾妍晋升为4-2

网易辟谣“AI清退外包员工”

Meta旗下元宇宙平台Horizon Worlds将于6月15日关停VR版

全站最新

2000万只“龙虾”进入企业，阿里的新企业Agent故事 | 最前线

第四届微信小程序全球创新挑战赛在香港启动

腾讯云安全团队腾讯研究院安全研究中心：腾讯云安全白皮书

97年女生！字节Seed研究员曾妍晋升为4-2

热门推荐

Meta 内部 AI 代理失控引发数据泄露，事故定性为 Sev1级安全事件

DeepSeek V4 招聘泄露玄机：AI 编程将成核心突破口

腾讯 4 月放出大招！混元 3.0 即将登场：天才科学家坐镇，龙虾军团全线出击

马化腾首谈“龙虾”应用:深耕AI Agent并坚持去中心化生态

微信将推原生 AI 智能体：打通小程序与支付，14 亿用户生活迎来新变革

苹果以违反规则为由，限制 AI 氛围编程应用在 App Store 更新

DeepSeek V4 呼之欲出：招聘信息泄露天机，编程能力直指 Claude？

阿里淘天启动 2027 届实习生招聘：技术岗占比超 9 成，首设 3 类 AI 专项岗

腾讯总裁刘炽平：2026 年 AI 新产品投入将翻倍，春节推广成果超预期

马斯克点赞！Kimi 论文撼动大模型“祖传地基”：同样算力，效率提升 25%

腾讯混元 3.0 定档 4 月：推理与智能体能力迎来重大升级

2000万只“龙虾”进入企业，阿里的新企业Agent故事 | 最前线

第四届微信小程序全球创新挑战赛在香港启动

腾讯云安全团队腾讯研究院安全研究中心：腾讯云安全白皮书

97年女生！字节Seed研究员曾妍晋升为4-2