当前位置: 首页 » 资讯 » 新科技 » 正文

智元发布首个通用具身基座大模型GO-1

IP属地 中国·北京 编辑:沈如风 时间:2025-03-10 10:32:04

3月10日,据“智元机器人”官微,智元今天正式发布首个通用具身基座模型——智元启元大模型(Genie Operator-1)。

据介绍,它开创性地提出了Vision-Language-Latent-Action (ViLLA) 架构。

该架构由VLM(多模态大模型) + MoE(混合专家)组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力。

三者环环相扣,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。