智能化竞争的下半场,辅助驾驶作为兵家必争之地,不同的技术路线相互竞逐。去年末,由特斯拉率先引入的“端到端”模型直接推动智能驾驶进入AI大模型时代。而现在,理想汽车有望凭借VLA司机大模型掀起新一轮的智驾风潮。
VLA司机,简而言之就是让AI成为“私人司机”。随着理想首款纯电SUV i8的上市交付,基于理想VLA司机大模型的下一代辅助驾驶技术也将同步升级至所有AD Max(Thor-U平台和Orin-X平台)。
VLA司机大模型也是理想汽车如今作为自研辅助驾驶引领者的又一创新落地。毫无疑问,它满足了当前的用户价值。据麦肯锡公布的报告显示,2024年超半数中国消费者购车时会考虑车辆的智能化程度。
一如既往,理想汽车不为技术而技术,每一次的创新与迭代如理想汽车CEO李想本人所言都是“为了解决问题”。就像理想决定先于纯电推出的增程技术,是为了解决电池成本高、用户充电难的问题;推出5C超充,是为了解决充电慢、用户等待时间长的问题。
在辅助驾驶技术层面上,理想汽车希望辅助驾驶能与人类驾驶表现对齐,增加用户使用辅助驾驶功能时的安全感。
在全量推送“端到端+VLM”不到一年的时间里,理想先于一众车企又推出了VLA司机大模型。持续进化的背后依然是理想对“用户体验”的坚持。“(理想)首先让之前用过理想辅助驾驶的老用户有个非常好的体验升级,其次也希望有更多没有用过的用户一上来就会对辅助驾驶有很好的感受和新鲜感。”理想汽车自动驾驶研发高级副总裁郎咸朋博士表示。
理想辅助驾驶技术持续进化,VLA司机大模型可真正实现像人一样思考
理想汽车自2021年起自研辅助驾驶,从最早的2D、3D感知开始研发,到BEV(鸟瞰图)、NPN(先验网络)、无图,再到“端到端+VLM”双系统架构和如今的VLA司机大模型,一步一个脚印地完成了技术储备。
其中,“端到端+VLM”被视为区分智驾技术的分水岭。在此之前,NPN轻图、无图均是人工时代的技术,而人工时代的最大特点是“规则算法”,需要工程师设计算法并编写程序,因此提升辅助驾驶性能依赖于工程师的能力和经验。
然而,从“端到端+VLM”开始,车企不再用传统的方式做,“端到端+VLM”架构的本质是模仿学习,指的是用人类驾驶数据训练模型,数据数量和质量决定性能。
不过,在自研“端到端+VLM”方案的过程中,理想又发现端到端在训练过程中遇到了性能增长放缓的瓶颈,因此又推出了VLA司机大模型。VLA不是简单地将端到端模型和VLM模型结合在一起。VLA司机大模型的本质是强化学习,具备自主思考的能力,用生成数据结合仿真环境训练模型,性能则由仿真迭代的效率决定。
需要指出的是,VLA司机大模型的诞生不只是为了解决性能方面的挑战。理想汽车董事长兼CEO李想曾表示:“端到端模型像猴子开车,它能够学习人类行为,但并不理解物理世界。因此也无法根据场景做出预防性判断。”
这些掣制到了VLA司机大模型阶段将不复存在。由VLA司机大模型赋能的车具备了感知、思考和适应环境的能力,从而真正实现像人一样思考的智驾:能够听得懂、看得见、找得到。
具体来说,用户现在可以通过语音指令改变车辆的路线和行为,比如直接跟理想同学说“开太快了”、“应该走左边这条路”等,车辆能够理解并执行这些指令;再比如如果用户在商场地库找不到车位时,可以跟理想同学说“找个车位停好”,车辆便可以自主寻找到车位,整个过程不依赖地图或导航信息,靠的是它对空间的理解和逻辑推理能力。
VLA司机大模型重塑用户体验,舒适度与安全感是重要考量指标
如前所述,VLA赋能的车辆将使其成为一个更好的“私人司机”。与此同时,理想认为就现阶段而言,在辅助驾驶的用户体验上,比起使用效率,他们更追求的是安全感和舒适度。“比如走错路,虽然效率有所损失,但我们不会通过一些危险的动作立刻纠正,还是要在安全和舒适的基础上追求效率。效率是排在安全和舒适之后的。”郎咸朋称,“这是我们现在想做的事。”
近年来,随着智驾能力的提升,其下限低的弊端也随之暴露。当智驾行为与人的驾驶行为不相符时,用户容易产生不安全的感觉。VLA司机大模型上车之后,因其具备思维能力以及自主学习能力,或将增加用户应对极端场景的信心。
据悉,理想车主的人驾数据是60万公里左右出一次事故,而在使用辅助驾驶功能的情况下是350到400万公里发生一次事故。“等到VLA模型提升后,我们希望在辅助驾驶功能下能做到600万公里(人类驾驶的10倍)才出一次事故。”郎咸朋表示。“除了安全性之外,我们重点提升了行车舒适度。如果体验了理想i8的辅助驾驶功能,会体验到舒适度比之前的版本有很大的提升。”
VLA作为i8的核心卖点之一,有望成为用户购买i8的一个重要因素。从理想官方公布的辅助驾驶相关数据可以看出,理想辅助驾驶不再是用户购买决策中的弱势项,而是驱动品牌销量增长的重要因素。截至2025年上半年,理想汽车的辅助驾驶试驾率已超过80%,试驾满意度达到92%,用户试驾占比连续10个月攀升。
“我认为有了VLA模型的加持,辅助驾驶会往更好的,一个移动空间的思路去发展。这个车能在安心、安全的基础上,帮你去做其他的事情,我相信那天很快就会到来。”郎咸朋说。
理想AllinAI,VLA不只用于智驾,有望赋能更多行业
李想在两次AI Talk采访中均表明了理想汽车要“成为一家全球领先的人工智能企业”的决心。为此,理想汽车在内部也成立了四支AI团队,并且研发投入近一半都投在了人工智能。又经过长时间的调研和探索之后,理想团队明确将VLA作为其长期的技术方向。理想汽车认为VLA与人类思维和思考能力是相似的,是最有可能实现L4级别的架构。
在i8上首发的VLA模型是理想第一版能上路的产品。不可否认,在某些长尾工况下,VLA仍存在不符合人类价值观的问题。为了让VLA模型在绝大多数场景下都能实现更接近人类的驾驶水平,需要企业有更好的数据、算力、工程部署支撑。
得益于销量增长,截至2025年7月,理想已经累计12亿公里的有效数据。12亿公里数据确保了场景多样性,再配合仿真环境来进行强化训练,理想将持续提升VLA体验。与此同时,理想所拥有的领先的工程落地能力也将支撑其VLA模型的快速迭代。自理想2021年开始自研智驾至今为止五年的时间里,其硬件平台已经从最初的基于地平线双J3芯片的硬件平台,升级到现在基于Thor-U芯片和地平线J6M芯片的硬件平台。
值得一提的是,VLA技术方案,并不是只适用于辅助驾驶相关,因为它的架构思路来源于机器人和具身智能领域。理想认为,VLA也是未来机器人领域的通用技术框架。某种程度上看,自动驾驶也是一个机器人,是带了四个轮子的自主行驶的机器人。“VLA架构会延续到机器人繁荣之后,才可能被其他技术替代。它的技术潜力非常大,也更像人类的智能发展规律。”郎咸朋表示,“VLA成功整合了空间智能、语言智能和行为智能,一旦跑通物理世界和数字世界结合的范式后,将有望赋能多个行业协同发展。”
众所周知,李想坚定地将AI视为未来所有业务的基石。其中,算法、算力、数据都是做好人工智能的前提。而基础训练算力和推理算力的支撑则需要大量的资金支持。理想有钱,如今他们手握超1000亿现金。同样重要的是,在抵达那个终极目的地之前,理想团队仍将保持着对前沿算法的探索,坚守他们所相信的,对抗捷径。