当前位置: 首页 » 资讯 » 新科技 » 正文

放弃动捕,全面转向纯视觉数据采集,特斯拉Optimus最新训练进展曝光!

IP属地 中国·北京 华尔街见闻官方 时间:2025-11-03 16:07:33

特斯拉正用纯视觉数据训练Optimus,让机器人真正用“眼睛”理解世界。

据Business Insider最新报道,特斯拉已将人形机器人Optimus的训练方式从动作捕捉转向纯摄像头数据采集,数十名数据采集员工在实验室内重复执行日常动作,为机器人学习人类行为提供视频训练素材。


报道称,自今年6月起,特斯拉放弃了此前使用的动作捕捉服装和远程操作方式,转而采用仅依靠摄像头的数据收集方法。工人们头戴装有五个摄像头的头盔,背负重达30-40磅的设备包,反复执行擦桌子、提杯子、拉窗帘等基础动作。

马斯克在第三季度财报电话会议上称Optimus“有潜力成为有史以来最大的产品”,并预计该公司最终将每年生产100万台机器人。他还表示,Optimus有一天可能占到这家汽车制造商价值的80%左右。

训练方式全面转向摄像头数据采集

特斯拉工程总部的一个玻璃实验室内,数据采集工人们执行着看似简单但极其精确的重复动作。每个动作都要在8小时轮班期间重复数百次,所有行为都被头盔上的五个摄像头和背包设备完整记录。

今年6月,在项目总监Milan Kovac离职后,公司告知员工将从动作捕捉服装和远程操作转向仅使用摄像头收集数据。工人表示,团队被告知这种方式能够更快地扩展数据收集规模。

除了工人身上的摄像头设备,特斯拉还在工作区域周围设置了固定摄像头。谢菲尔德大学机器人专家Jonathan Aitken表示,这些固定摄像头塔能够提供更广阔的环境视角,补充身上摄像头的数据。

工人们有时还配备触觉手套,用于追踪手部的细微动作。马斯克曾表示,特斯拉在为Optimus开发类人手部方面投入了大量精力,称其为"极其困难的工程挑战"。

AI生成任务指令覆盖复杂动作场景

特斯拉已开始使用AI生成的提示来帮助训练机器人。在某些训练练习中,工人通过连接到背包的头戴设备接收一系列AI生成的指令,需要在3-5秒内完成每个动作。

据工人描述,这些练习包括下蹲、做“鸡舞”、模仿大猩猩、假装吸尘、短距离冲刺、假装打高尔夫球等动作。一些任务甚至包括婴儿智力游戏,如按大小和颜色套环,或将形状放入相应的槽中。

两名数据采集员提到,有些AI生成的任务让他们感到不适,包括四肢爬行或脱掉衣服的要求。不过专家认为,这些看似随机的任务可能帮助特斯拉了解需要改进的领域。

在弗里蒙特工厂,数据采集员还会在佩戴头盔和背包的情况下整理车辆零件,在传送带上工作。专家表示,为同一任务收集不同的数据点对训练很有帮助。

机器人实际表现仍面临技术挑战

尽管在公司视频中,Optimus能够行走、叠衣服、表演功夫动作并在时代广场分发糖果,但实际训练中的表现差距明显。


报道称,两名工人表示,机器人在执行需要弯曲或倾斜的任务时,有一半时间会摔倒,有时会损坏昂贵的设备。除非执行需要移动超过几英尺的任务,否则通常会被绑在支撑架上保持直立。

Aitken表示,在特斯拉办公室这样的受控环境中,机器人应该能够轻松保持直立。“让它站起来并保持平衡应该是你首先要解决的问题之一。”

俄勒冈州立大学AI和机器人专家Alan Fern指出,机器人演示“总是他们能向你展示的最好演示”。当看到它表演功夫时,虽然看起来在做智能的事情,但“它只是对环境做出反应,背后没有认知思考”。


目前,超过100人曾参与数据收集工作,但公司在9月的半年度绩效评估后裁减了数十名数据采集员。工人们根据任务执行情况评分,每个轮班需要收集至少4小时的可用视频素材。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。