当前位置: 首页 » 资讯 » 新科技 » 正文

特斯拉高管详解端到端自动驾驶系统:摒弃模块化架构

IP属地 中国·北京 编辑:李娜 IT之家 时间:2025-10-27 10:21:11

IT之家 10 月 26 日消息,特斯拉人工智能与自动辅助驾驶软件副总裁阿肖克・埃卢斯瓦米(Ashok Elluswamy)近日罕见地揭秘了该公司的人工智能系统是如何学习驾驶的。IT之家注意到,在参加完国际计算机视觉会议(International Conference on Computer Vision)后,埃卢斯瓦米通过社交媒体平台 X 发布了一篇长文,详细介绍了特斯拉“端到端”神经网络的技术原理。

根据埃卢斯瓦米的阐述,目前大多数自动驾驶公司依赖的是模块化、传感器密集型系统,将感知、规划和控制三个环节彼此分离。而特斯拉则采取截然不同的方法 —— 将这三个功能整合进一个统一的、持续训练的神经网络中。他解释道:“梯度信号从控制层一直反向传播至传感器输入层,从而实现对整个网络的全局优化。”

他指出,这种架构的优势在于可扩展性以及更贴近人类思维方式的推理能力。通过真实驾驶场景示例,他表示,特斯拉的 AI 能够学习并掌握细微的价值判断,例如决定是绕过路面积水,还是短暂驶入对向空车道以确保安全通行。“自动驾驶汽车无时无刻不在面对‘微型电车难题’,”埃卢斯瓦米写道,“通过在人类驾驶数据上进行训练,机器人得以学习与人类价值观相一致的行为准则。”

他还强调,该系统使 AI 能够理解复杂的意图判断,例如识别道路上的动物是准备穿越还是原地停留。这类细微行为若采用传统编程方式手动编码,难度极高。

埃卢斯瓦米坦言,这一技术路径仍面临巨大挑战。特斯拉的 AI 系统需处理来自多摄像头、导航地图及运动学数据的数十亿个“输入标记”(input tokens)。为应对如此庞大的数据量,特斯拉依托其全球车队构建了一个被称为“数据瀑布”的庞大资源池,每天产生的驾驶数据相当于 500 年的实际驾驶经验。随后,先进的数据管道会从中筛选出最具价值的训练样本。

为了提升神经网络的可解释性和可测试性,特斯拉开发了一系列专用工具。其中,“生成式高斯点阵渲染”(Generative Gaussian Splatting)技术可在毫秒级时间内重建三维场景,并无需复杂配置即可建模动态物体。此外,特斯拉自主研发的“神经世界模拟器”(neural world simulator)使工程师能够在高度逼真的虚拟环境中安全测试新的驾驶模型,并实时生成高分辨率、具备因果逻辑的响应。

埃卢斯瓦米最后表示,这一相同的神经网络架构未来也将应用于特斯拉人形机器人 Optimus。“这项工作最终将极大造福全人类,”他说道,并称特斯拉是“当前全球从事人工智能研究的最佳平台”。

标签: 埃卢斯 模块化 数据 架构 系统 人类 方式 技术 神经网络 人工智能 高度 场景 地图 编程 编码 计算机 物体 神经 规划 方法 梯度 网络 空车 汽车 道路 经验 视觉 建模 模拟器 手动 国际

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。