
“试驾完端到端后,李想对AI的态度从怀疑跨越到震惊。”
作者丨王瑞昊
编辑丨林觉民 李雨晨
“如果不往端到端转,你们就别干了。”
在2024年3月的春季战略会上,李想当着公司自动驾驶团队的面,毫不客气地扔下这一句话。他对当时智驾的表现极度不满,直言理想智驾已经到了必须“破釜沉舟”的关口。
四个月后的2024年7月5日,理想汽车正式发布“端到端+VLM”系统。这不仅是一套技术的亮相,更是理想智驾发展道路上的分水岭。
在此之前,理想的智驾研发像是一场持久的追赶战,短短四年间先后迭代了五套技术方案,从有图到轻图,再到无图,每一步都在追赶却始终达不到行业头部。
直到第六套方案“端到端+VLM”登场,才让理想终于从长期的追随中,第一次体会到真正的领先。
一位深度参与该项目的内部员工告诉雷峰网,轻图与无图方案只是让理想得以坐上自动驾驶的牌桌,而端到端方案,则让理想在这张牌桌上打出了自己的胜局。
2024年7月,“端到端+VLM”先在1000名早鸟用户中试水,反馈好得出奇。一个月后,这一功能出现在门店试驾车上,随即点燃了市场热情。到了10月,智能驾驶试驾占比已经达到65%,到年底几乎成为用户进店体验的“标配”。
用户对端到端方案的热情,也迅速转化为销量表现。
2024年全年,在30万元以上车型中,AD Max(搭载“端到端+VLM”的车型)交付占比高达75.4%;在40万元以上车型中,这一比例更是达到84.6%。而在同年2月,这一数字还只有20%。
01
再立军令状
时间拨回到2024年初,彼时的理想智驾团队仍被焦虑和不安笼罩。那时他们刚刚转向无图NOA,却发现自己依旧落后于华为和小鹏一步,前途充满不确定。谁能想到,仅仅数月之后,端到端的落地,会让理想迎来反转时刻。
在此之前的2023年,理想汽车开始全面向华为学习,包括自动驾驶战略也在参考华为模式。
华为在自动驾驶领域的整体战略可以概括为“人海战术”,拥有约5000名智驾工程师,行业最多。受此启发,理想汽车自2023年起大力扩充自动驾驶团队,从年初的五六百人迅速增长到年底的超过1000人。
但团队规模的迅速扩张,并未带来理想预期中的效果,距离智驾追赶华为的目标仍有较大差距。
华为的城市NOA在2023年底实现“全国都能开,有路就能开”。理想的城市NOA虽然在同期也开通了110个城市,但支持区域受限,仅能在城市主干道开通该功能。
更让智驾团队焦虑的是,城市NOA全面推送给用户后,收获了一片差评,不仅遭到车主吐槽,甚至还受到内部员工的批评。
城市NOA刚一推送完,郎咸朋便带领智驾团队全力投入无图NOA的研发。他们将全部希望押在这一方案上,期盼无图NOA的用户体验能够真正追平华为,为团队赢回信心。
在2024年春季战略会上,当讨论如何学习华为研发无图NOA时,内部有人建议:既然华为组建了超过5000人的研发团队,那理想至少应组建一支超3000人的团队来推进这项工作。
该提议立刻招来李想的强烈反对。
李想对团队坦言,他已厌倦了每天“卷”那些corner case(危险场景)的补丁工作:“你永远也打不完,即便堆再多人也没用。”他顿了顿,目光扫过每一位团队成员:“我们必须升维竞争,要有光脚不怕穿鞋的心态,反正我们也不是行业头部。”
这场战略会之前,郎咸朋心里一直忐忑:如果端到端方案做不成,该怎么办?李想却沉着地告诉他:“理想没有历史包袱,现在端到端正是我们的机遇,我们就应该抓住它,并为此孤注一掷。”
在决定转端到端之前,李想已具备一定的AI认知,他敏锐地察觉到,以AI技术为核心的端到端方案,正是理想实现弯道超车的机会。
2022年底ChatGPT的发布对李想产生了巨大影响,他认为理想是时候下场做AI了。(为什么ChatGPT发布后,李想对AI的认知发生了变化,其中细节,欢迎添加作者微信Hugh-wangruihao交流)
一位接近李想的人士告诉雷峰网,ChatGPT发布后,李想对AI的认知发生了很大变化。
自2023年起,李想便开始积极提升自己在AI领域的认知。最初,他拉了十几二十个人,每周定期聊AI。团队会向他分享正在做的实践案例、最新的论文研究,李想的学习速度令人惊讶。
隔了一段时间后,李想干脆取消了其它例会,只保留了AI周会。随着周会次数的增多,团队发现李想的AI认知迭代速度惊人,几乎是一周一个迭代。
他异于常人的地方在于,不仅能快速理解复杂概念,还能把晦涩难懂的技术转化为任何人都能理解的类比。
例如,当团队讨论如何将大模型能力引入现有系统时,他形象地把现有能力比作“猴子”:猴子可以模仿人,但永远不可能变成人。他指出,仅做“猴子”的模仿学习毫无意义,关键在于理解整个逻辑链条——从模仿学习到大模型——就像区分猴子和人的本质差异一样。
为了让全公司认识到AI的重要性,在2023年初,李想将公司愿景从 “成为全球第一的智能电动车企业” 变更为 “成为全球领先的人工智能企业” 。
在李想的影响下,理想高管团队也在快速迭代自己的AI认知,其中就包括自动驾驶业务负责人郎咸朋。
2023年5月,理想高管团队——包括智能座舱负责人勾晓菲、产品负责人范皓宇,以及郎咸朋等人,一行人组团前往美国硅谷,进行AI考察与交流。
雷峰网获悉,当时郎咸朋不仅亲自试驾了特斯拉的FSD,还专程拜访了特斯拉自动驾驶团队,进行深入交流与学习。
当时正值特斯拉即将推出具有革命性意义的FSD v12版本之际。
特斯拉于2024年1月正式向用户推送FSD v12,这一更新被视为自动驾驶行业的重要里程碑。与传统依赖人工编写规则和标注的方式不同,FSD v12首次引入端到端技术:通过向大模型输入数百万段视频片段进行训练,取代了原有的30多万行C++代码。
就在FSD v12被广泛讨论但还未有车企跟进之际,2023年底,理想汽车悄悄启动了端到端方案的预研。
理想汽车的研发模式遵循“交付一代、研发一代、预研一代”。当时,无图NOA刚进入研发阶段,仅有少数研发人员负责端到端的预研工作。由于团队的工作重心全部放在无图NOA的研发与交付上,郎咸朋尚未为端到端的研发和交付设定具体周期。
在理想汽车,研发与交付都有严格的时间周期,到了节点必须交付成果,否则将直接影响考核。
事实上,上一代方案“轻图”的研发和交付已经让郎咸朋意识到,如果一直按照华为模式推进,理想的智驾恐怕难以突破。
华为在自动驾驶领域的两大优势——庞大的工程师团队和完整的制图资质,是理想不可能具备的。
2024年3月的春季战略会上,李想的一番发飙彻底点醒了郎咸朋。他终于意识到:照目前的做法,理想永远追不上华为,即便做到和别人一样好,外界仍会觉得小鹏和华为更强。唯一的出路,就是硬着头皮把端到端方案做出来。
那次战略会上,郎咸朋第二次在李想面前立下军令状,语气坚定而带着一丝紧绷:“想哥,你也别骂了,这话我先放这里。今年6月份,我一定把端到端做出来,效果要超过现在的无图方案。如果做不出来,到时候你开我,或者我自己走。”
郎咸朋第一次在李想面前立下军令状,还是在2021年的“卫城计划”期间。那场战役让理想在自动驾驶领域具备了自研能力。如今,再次立下军令状,他也意识到,这一次的挑战比以往任何一次都更加艰巨。
02
100天倒计时
2024年3月春季战略会一结束,郎咸朋便着手启动端到端项目组的组建工作。彼时,无图NOA的交付仍在紧张推进中,他没有动交付团队的人手,而是选择从其他部门招募志愿者,组建起专门攻坚端到端项目的队伍。
就像当年卫城计划初立时被普遍质疑一样,这一次,端到端项目在理想内部同样不被看好。彼时业界对端到端还停留在概念层面,没有任何成功的落地案例,小鹏、华为的相关探索也都还处于萌芽阶段。
就连理想自动驾驶团队内部有些人也觉得是痴人说梦。
于是,郎咸朋选择以“秘密招募”的方式组建团队。他在部门大群里发出一则简短的招募贴,并未点明是端到端项目,而是这样写道:我们正在启动一个秘密项目,难度极大,风险极高,也不一定能成功。但如果能做成,它将让我们一举超越所有竞争对手,直接跃升到行业第一。至于项目具体内容,我现在不能透露。如果你有兴趣或想法,可以主动来报名。
郎咸朋希望借此招募到真正自愿加入的战士,而不是被动分配、心不在焉的人。只有主动投身其中的人,才会把职业命运与项目紧密捆绑,抱着背水一战的决心去拼这一仗。
4月15日,在理想中关村研发中心举行的首次誓师大会上,现场只有12人参会。这12人在听完郎咸朋阐述端到端的理念后,被深深打动,随后主动去动员身边志同道合的同事加入。就这样,项目逐渐在正式启动时,成功聚拢了约100名核心成员。(端到端项目组建初期,为什么招募不到人员,其中细节,欢迎添加作者微信Hugh-wangruihao交流)
郎咸朋为端到端项目取名“达摩克里斯”,寓意每个人头顶都悬着一柄利剑,随时可能坠下,成败一念之间,唯有全力以赴才能保全自己。当时郎咸朋对端到端项目的态度是注一掷、破釜沉舟,没有退路,只有成功这一条路。
![]()
在理想中关村办公室,郎咸朋专门将《达摩克利斯》油画打印并挂在墙上。
郎咸朋将端到端研发的重任交给了夏中谱。
夏中谱于2023年从百度加入理想,初到公司便与郎咸朋一同推进百城 NOA 的交付,随后又成为无图 NOA 研发的中坚力量。他最大的优势在于对算法有着深刻而独到的理解,因此郎咸朋放心地把端到端研发的核心工作完全交由他统筹。与此同时,团队的二号人物贾鹏则负责 VLM 的研发,两条研发线并行推进。
夏中谱于2016年从中科院博士毕业,博士期间主要研究强化学习,这在当时属于前沿方向。他所在的课题组是国内最早开展强化学习研究的单位之一,理论积淀深厚。
2016年夏中谱参加各公司面试时,强化学习在国内仍鲜有人涉足,那一年正值阿尔法狗热潮,他的专业背景为进入百度提供了机会。加入百度后,夏中谱进入 L4 自动驾驶部门,工作了约八年。
在此期间,他始终专注于用强化学习解决核心问题,主要聚焦决策与规划领域。八年间,他参与了三代技术开发:第一代负责障碍物预测,第二代推进学习化决策,第三代实现联合规划。这些算法最终成为百度 L4 系统的核心,并展示在阿波罗(Apollo)开源平台上。
夏中谱加入理想汽车初期,理想智驾团队基础相对薄弱,行业认可度不高,也很难吸引到顶尖人才。再加上早期投入有限,许多优秀人才被华为、小鹏、蔚来等公司吸引走。因此,在轻图和无图 NOA 研发阶段,除了技术研发,夏中谱的另一项主要工作就是组建团队、搭建组织架构和技术基础设施。
这为端到端项目的启动打下基础。
到了2024年2月,端到端预研人数得到增加,夏中谱的团队规模扩大到约40人;随着4月份项目组的成立,他带领的团队逐步扩展至约180人。
不到一个月,夏中谱便带领团队研发出了端到端的Demo版本。5月15日,一辆搭载端到端Demo的车被郎咸朋开上了路。车子虽然开得歪歪扭扭,但有一个亮点尤为突出——纵向控制表现异常出色,远超此前的有图和无图方案。当时副驾的贾鹏被郎咸朋问道:“贾老师,这是你特调过的吧?”
贾鹏摇头:“郎博,没有,我们也觉得很神奇。”
仅靠把数据输入到模型训练,效果就远超当初团队手动编写的上万条规则。到这一天,团队首次真正意识到,端到端方案,很可能真的能实现。
夏中谱带领团队又攻坚了一个月,并在6月1日交出了优化后的Demo。
当时正值李想准备前往6月8日举办的重庆论坛之际,在出发前两天,郎咸朋带他首次体验端到端试驾,车上还坐着张颖——李想私交最好的投资人之一。
这是李想第一次试驾端到端,郎咸朋压力巨大,甚至做好了如果体验不佳,当场辞职的打算。
在李想试驾端到端的前一天,郎咸朋在内部召开了一次小会,讨论无图版本的交付时间。
产品团队和交付团队都给郎咸朋施压:“郎博,我们要做两手准备,如果端到端失败了,我们还能有无图版本交付,所以你必须留人留资源,把无图版本交上。”
郎咸朋当场反驳:“你们能不能相信我一次?要么就别做端到端,要做就把它做好。如此瞻前顾后,怎么可能成功?”
郎咸朋情绪激动,坚持认为端到端只需再等一个月,就能显著超越现有能力。在5月15日的试驾中,端到端仅经过一个月研发,其纵向控制能力便已全面超越之前的规则版本;再给一个月,其成长潜力将令所有人震惊。
由于其他人尚未对端到端有直观体验,这次会议后,公司紧急召回了已被裁员的50人去负责无图版本的交付。
但仅仅过了两天,李想亲自试驾后,团队的所有质疑都烟消云散。
试驾当天,陪同李想一起上车的,还有他的老朋友、经纬创投管理合伙人张颖。张颖不仅是理想汽车的早期投资人,更是李想在创业路上最信任的私交伙伴之一。
两人认识已久——早在理想汽车最艰难的融资阶段,张颖曾三次伸出援手。李想后来在公司上市演讲中公开感谢三人,除了CFO李铁、推荐145位车主的老友外,张颖是唯一被提名的投资人。他在台上说:“公司每次遇到融资难题,张颖总是第一个冲上来帮忙。”
这一次,张颖再次出现在理想的重要时刻。
那天,李想在北京顺义总部附近试驾理想最新的端到端版本。车辆自动行驶着,最初他沉默不语,神情专注;随着系统在复杂路况中一次次平稳应对,他的表情逐渐舒展,语气也越来越兴奋,不时转头与张颖交流:“哎,这真好!未来的自动驾驶就该这么做。”
张颖坐在副驾,目光始终盯着前方,也忍不住笑出声来。他评价道:“这是我体验过的智驾系统中,表现最好的一版。如果满分是10分,我会给今天试驾打9分。”
李想的兴奋一直持续到重庆论坛。原本团队为他的演讲准备了其他内容,但他临时自行改稿,全程脱稿讲述理想自动驾驶的发展路线与未来愿景。
![]()
2024年重庆论坛,李想脱稿演讲 图源:中国汽车重庆论坛
在试驾此前的智驾系统时,李想最多只是认为数据是个不错的工具,但这一次的端到端体验彻底改变了他对 AI 的认知,他更加深刻体会到AI能力的强大:“我靠,原来这个模型,能力竟然这么强。”
自此之后,理想内部才第一次真正开始相信端到端。
2024年底,李想宣布理想汽车将All in AI,这一决定,与他第一次试驾端到端所带来的震撼密切相关,正是那次经历让他下决心全面押注AI。
李想试驾后,郎咸朋获得了更多资源全力推进端到端项目。此后,夏中谱领导的算法团队规模从原先的40人扩大至160人,数据、仿真与测试团队也扩展到近300人,使整个端到端项目的总人数超过400人。
2024年7月5日,理想正式举办发布首次对外发布了端到端方案,并在同月完成了千人推送。
![]()
智驾团队参加参加AI talk录制,从左到右分别是:詹锟、郎咸朋、贾鹏
此后端到端项目进入用户交付阶段。
2024年10月23日,理想“端到端+VLM”开启全量推送,率先支持城市场景。
2025年1月16日,“端到端+VLM”将支持场景拓展至高速和环路,理想由此成为国内唯一、全球第二家将端到端技术应用于全场景的车企。
一位深度参与端到端项目的内部员工告诉雷峰网,从4月份项目启动到7月份交付,大约只用了100天,中间没有出现过任何纰漏。相比之下,其他公司如华为、小鹏等,在端到端方面至今未达到理想当时的一段式端到端水平。而理想仅用100天就完成了千人推送,并在10月份实现全量推送,隔年1月份完成了高速和城市场景的统一。
理想的端到端量产奇迹,带给行业的启示是多方面的。
03
效率与技术的对撞
理想的端到端,第一次让行业见识到了如何花最少的钱,办最大的事。
一位内部员工向雷峰网透露,理想端到端项目的核心算法团队不足200人,相比竞争对手华为、小鹏、蔚来等少得多;即便算上整个项目总人数,理想也仅超400人,而竞争对手的自动驾驶团队规模通常都超过1000人。
在如此有限的投入下,理想的端到端项目却取得了惊人的成功——它不仅让理想的智驾水平一跃成为行业头部,还直接带来了销量。在此之前,智驾功能更多只是锦上添花,很难成为促使消费者下决心购车的关键因素。
2024年初,AD Max车型在理想整体销量中的占比仅为20%;但自7月份端到端完成千人推送后,这一局面迅速发生逆转。
千人推送验证效果良好后,理想迅速将端到端推广到线下门店,一时间掀起了消费者的试驾热情,试驾端到端的用户比例陡然上升至超70%,不少消费者反馈,端到端体验甚至优于华为的乾崑智驾。
到了年底,搭载端到端智驾系统的车型在理想整体销量中的占比已超过70%,相比年初的20%实现了大幅跃升。
理想的端到端项目从4月份启动研发到7月份完成千人交付,仅用了约100天。这得益于整个研发与交付过程中没有出现任何纰漏,否则项目进度本可能大幅延误。
100天奇迹首先要归功于团队的通力协作和应用技术的领先性。
理想端到端项目的技术负责人是夏中谱,他2023年加入理想后负责智驾系统的决策规划模块,当时郎咸朋给夏中谱的定位是:用数据的方式,打造理想下一代自动驾驶系统。
![]()
夏中谱(右一)驾车测试端到端系统
夏中谱在2023年加入理想后便着手端到端预研,但当时主要任务仍是交付有图和无图NOA,真正专注于端到端的预研团队只有几个人。直到2024年2月,整个端到端组织才完全划归给夏中谱,夏中谱算法团队规模增加到40人;到了4月份,预研阶段结束,郎咸朋告知夏中谱开始为量产做准备。
从4月15日到7月,仅不到100天的时间,夏中谱带领团队便完成了端到端千人推送的交付,这一过程之快在行业内极为罕见。整个研发过程中,团队基本没有出现任何错误,否则7月份的交付根本不可能如期完成。值得注意的是,当时团队算法规模仅有40人,算力配置也只有2000卡,是最小化配置条件。(夏中谱为什么能凭借2000张卡就做出了端到端,其中细节,欢迎添加作者微信Hugh-wangruihao交流)
从早期算法定义、数据定义,到线上框架和产品定义,夏中谱几乎从零搭建了整个系统。在此过程中,确保各个模块及各个团队之间的紧密协作成为核心挑战。
一位项目成员告诉雷峰网,团队成员之间的高效配合、信息流通和协作执行,是端到端项目能够在如此短时间内顺利推进、并且无偏差完成的关键经验。
另一个关键在于前瞻性地应用了一段式端到端技术。
一段式端到端是一种设计非常前沿且非常干净的技术,突破了传统模块化方法的局限。传统自动驾驶研发通常依赖规则化和模块化方式:感知、地图、规划与控制、数据和仿真测试各自独立运作。虽然这种方法可以快速跑通最小闭环,实现局部优化,但最终只能得到局部最优解,难以形成全局最优。
端到端大模型技术将感知、规控、定位、地图等模块集成到一个网络中,一次性处理所有任务,实现系统化设计。数据从一开始就经过精心规划;模型训练直接以任务目标为导向,无需拆分成多个独立模块;测试环节围绕端到端算法定制设计,从而提高效率并降低复杂度。通过云端、车端与算法的紧密配合,整个系统能够实现全局最优,以最低成本、最快速度完成研发。
夏中谱的优势在于,他是一个对自动驾驶全领域、全技术都非常精通的人,清楚地知道每个模块的短板在哪里(以前每个模块都是独立的,一个的短板就是整体的短板),并能通过全局思维,将一个模块的短板用其它模块弥补,使各个模块形成合力,从而实现全局最优。
对于郎咸朋和夏中谱来说,在这个过程中,不仅要求他们对整个技术体系有全面的理解,同时还要明确技术架构如何与组织协同配合。这不仅关乎技术本身,还涉及人才梯队的建设,需要将人、事、组织以及它们之间的关系有机协调,用系统性的思维进行拆解和把控,这一点至关重要。
正是这种对技术与组织的双重统筹,使端到端项目在不到100天的时间里完成千人交付,并迅速实现全量推送与场景拓展,从而让理想汽车在智能驾驶领域实现了弯道超车。
![]()
长里程路测端到端的高速性能
04
数据的胜利
如果把这100天的量产奇迹比作一次聚光灯下的舞台演出,那么能否成功,表面上取决于演出的内容是否契合时代潮流,以及每位演员之间的默契配合。但决定性的因素,实际上是这场演出背后长达数年的持续准备与积累。
对于理想来说,决定100天量产奇迹的决定性因素在于,郎咸朋从入职理想起就开始搭建的数据闭环系统。
这也正是理想能够用数百人的团队,交出媲美甚至超越竞争对手数千乃至上万人团队成果的智驾系统的根本所在。
郎咸朋第一次感受到数据的重要性来自于他在百度时期的一次研发经历。
在2014年到2015年期间,郎咸朋担任百度街景业务部门的技术负责人。当时,街景部门的算法资源十分有限,为提升街景识别率,郎咸朋主动寻求支持,找到时任百度IDL常务副院长余凯,请求借助深度学习技术来突破瓶颈。余凯随即调派了IDL的核心成员、时任百度高级科学家黄畅前来协助。 在黄畅的协助下,街景识别率一路被提升至86%。当时黄畅对郎咸朋说了一句话:“我们已经用上了世界上最先进的模型。”
![]()
黄畅(右一)、余凯(右三)
在此之前,郎咸朋依靠传统机器学习的方法,识别率可以做到70%左右。
那是一个需要“人海战术”的年代。彼时,百度街景的数据采集刚刚起步,车辆跑遍全国各大城市,带回来的数据量以几百个T 计。仅北京这样一个大型城市,道路里程就有两三万公里。问题随之而来——国家规定,街景不能出现人脸和车牌等敏感信息。于是,必须在所有图像里,把这些信息一一抹掉。
怎么做呢?只能靠人力。街景团队本身就有三五百人,再加上外包团队,规模一度扩张到上千人。每天的工作,就是逐帧逐张地标记图像,把人脸和车牌打上框,再做模糊处理。这是个没完没了的工程。全国四百多个城市的数据量压下来,工作量巨大,既耗钱、又耗人,更关键的是耗时间。
团队当然想过用算法来减轻负担。当时人脸识别和车牌识别在学术层面已经有成果,可一旦落到真实世界,问题立刻暴露出来:鱼眼相机带来的严重畸变,让人脸和车牌变形得面目全非;公交车广告上的人脸经常被错认成真实人脸。
自动化的识别率最高只能做到70%,而且其中还有不少误判和漏判。假如一张图里有100个需要打码的地方,算法只能标出70个,还可能错掉其中的30 个,剩下的30个完全漏掉。这种“半吊子”的结果,反而需要人花更多时间去修正。相比之下,还不如直接全程人工。
更让人头疼的是,街景里可不只是路人和车牌。有时,国家档案馆、公安局,甚至一些不挂牌的涉密单位门口,这些敏感人物和场景,绝对不能有一丝遗漏,否则后果严重。
在这样的压力下,团队只能继续依赖人力。但所有人都明白:这是条走不通的路。于是,郎咸朋找到了余凯团队前来协助。
黄畅很快做出了模型,识别率提升到了86% ——相比原来的70%已经是飞跃式的提升。但即便如此,仍然与人工95%左右的水准差了关键的9个点。郎咸朋追问余凯、黄畅能不能再提升,得到的回答却是:“郎博,你再找全世界任何一个人来都不可能了。我们已经用上了最先进的模型,这是极限了,你们自己想办法吧。”
这段经历让郎咸朋第一次真切感受到:真实世界的复杂性,远比实验室里的理论要复杂得多。
万般无奈之下,郎咸朋决定换个思路——不用去追逐“更聪明的大脑”,而是想办法让“脑子吃饱饭”。他意识到,再强大的模型,如果输入的数据不够充分,也难以产出理想的结果。
当时用于训练的样本图片量是一万张左右。在那个年代,这已经算得上“大规模”了。于是,郎咸朋将样本量扩大10倍至10万张,并且带领团队上手精标了其中的5万张。这次,郎咸朋没有使用黄畅研发出的“世界上最先进的模型”,只使用了普通的开源CNN框架,结果以一训练,识别率直接冲到了 90%。
那是郎咸朋第一次见识到数据的威力,大家的眼睛一下就亮了,“原来在AI世界里,数据才是第一生产力。算力差点、模型差点都没关系,只要数据好,结果就有效。”
这个发现瞬间调动起了所有人的热情。大家一鼓作气,把十万张样本全部精标完成。新的训练结果更是令人振奋:车牌识别准确率达到99%,人脸识别率也稳定在97%。这不仅超越了人工标注的95%,更重要的是,彻底摆脱了对上千人外包团队的依赖。识别交给机器后,只需加数据,就能源源不断“哗哗”地跑出结果。
这对公司而言,是一次真正的降维打击:成本骤降,效率暴涨。当时郎咸朋的上级顾维灏看到结果后都惊讶不已:“郎博,原来这个能做到这么好?赶紧推!”
效果甚至引来了竞争对手的关注。那时腾讯地图也在做街景,是百度地图的直接对手。他们的人跑来打听:“你们是怎么做到的?怎么能又快又好?”
前后对比的冲突极为鲜明:从最初上千人耗时耗力地手工标注,到后来依靠深度学习+大规模高质量数据,不仅识别率超过人工,还一举解决了效率和成本问题。这次突破,让郎咸朋第一次切身体会到:AI的真正壁垒,不是模型,而是数据。
从此,数据驱动的理念成为郎咸朋开展研发的核心武器。
2017年,李想曾问郎咸朋,在自动驾驶中哪一项最关键。郎咸朋回答:数据。没有足够的数据去区分和训练,再强的算力和最优的算法也无法充分发挥作用。(郎咸朋离开百度后为何加入理想汽车,其中考虑,欢迎添加作者微信Hugh-wangruihao交流)
2018年加入理想后,郎咸朋便开始着手搭建数据闭环系统,构建起完整的获取、处理与应用数据的体系。到了2019年第四季度,理想交付第一辆车时,这套系统便正式投入运行。
为了获取更多且更高质量的数据,从理想的第一款车型理想ONE开始,智驾系统的软件和硬件就全部标配,使每辆车都具备完整的数据收集与采集能力。在国内车企中,只有理想做到这一点,其他厂商要么硬件不是标配,要么软件需要额外付费。
郎咸朋对传感器布局极为坚持,他对李想说,无论是L6、L7、L8还是L9车型,传感器的布局必须保持一致。可以更换芯片,但传感器的位置和数量不能更改。曾有人建议更换部分传感器,郎咸朋明确表示,可以去掉激光雷达,但视觉和图像传感器的布局必须完全按照原设计执行。
这种统一的布局保证了每辆车采集的数据标准化和可比性(可以复用),使得整个数据闭环系统高效运作,并为后续算法训练提供了可靠、统一的数据基础。
截至2025年8月29日,理想用户辅助驾驶总里程达到49亿公里,作为比较,截止到2025年7月,华为乾崑智驾活跃用户数达70万人,智能辅助驾驶总里程突破35亿公里。
从2021年的卫城计划,到2024年的端到端方案,郎咸朋带领理想智驾团队在短短三年间完成了五轮技术方案迭代,实现了智驾水平从落后到追赶,再到行业领先的三级跳。
对于数据的认知,是理想智驾在过去几年反超速度快,交付效果好的根本原因。
进入2025年,理想汽车的智驾系统再次迭代到了VLA方案,那么,这一次,它凭借什么实现领先?
本文作者长期关注理想汽车,欢迎对理想汽车感兴趣的读者添加作者微信 Hugh-wangruihao 交流。





京公网安备 11011402013531号