当前位置：首页 » 资讯 » 新科技 » 正文

灵初智能发布首个基于强化学习的端到端具身模型 Psi R0

IP属地中国·北京 编辑：沈如风 IT之家 时间：2024-12-30 14:39:18

12 月 30 日消息，灵初智能发布首个基于强化学习（RL）的端到端具身模型 Psi R0。
获悉，该模型支持双灵巧手协同进行复杂操作，将多个技能串联混训，生成具有推理能力的智能体，从而完成并闭环长程灵巧操作任务。并且，Psi R0 还可以实现跨物品、跨场景级别的泛化。
以电商场景为例，商品打包是典型的长程任务作业，需对上万件商品进行抓取，扫码，放置，塑料袋打结等多个操作。Psi R0 能够使用双灵巧手流畅地完成这一系列动作（官方称此系列动作在客户现场可以取代一个完整工位），成为首个基于强化学习训练完成长程灵巧操作任务的具身机器人。
官方表示，基于 RL 的 Psi R0 模型，使用海量仿真数据训练出双手操作的智能体，并通过双向训练框架串联多技能，在业界率先完成开放环境中的长程任务，具备较强的泛化能力与较高的鲁棒性（robustness）。
这一技能训练框架从物体时空轨迹抽象出关键信息以构建通用目标函数，从而解决奖励函数难设计的问题。在后训练阶段，通过少量高质量真机数据对齐，进一步提升长程任务的成功率。
除此之外，双向训练框架中的转移可行性函数发挥着重要作用，它能够微调技能以提高串联的成功率与泛化性，同时赋予模型自主切换技能的能力，使其在遭遇操作失败时能够迅速调整策略，确保高成功率。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

豆包大模型日均Token使用量超120万亿

消息称Meta低调组建硬件团队，打造以多种形态陪伴人类的智能体

专业的成都小程序开发机构

2026科大讯飞语音转文字零基础避坑指南步骤清晰包教包会可直接上手

满地“小板凳”

广东8款新增备案大模型“领证”，累计132款居全国前列

全站最新

豆包大模型日均Token使用量超120万亿

消息称Meta低调组建硬件团队，打造以多种形态陪伴人类的智能体

专业的成都小程序开发机构

2026科大讯飞语音转文字零基础避坑指南步骤清晰包教包会可直接上手

热门推荐

豆包大模型日均Token使用量超120万亿

消息称Meta低调组建硬件团队，打造以多种形态陪伴人类的智能体

专业的成都小程序开发机构

2026科大讯飞语音转文字零基础避坑指南步骤清晰包教包会可直接上手

满地“小板凳”

广东8款新增备案大模型“领证”，累计132款居全国前列

小米、京东等互联网大厂同时出手！杭州这家公司用一双“手”再拿下数亿元融资

2026年产品经理如何提升自身知识与职业发展加速？核心能力提升路径与系统方法解析

优推信息：多年百度关键词搜索排名，百家号SEO排名收获流量红利

马斯克：唯一能让美国摆脱债务危机办法，就是发展人工智能机器人

谷歌，真的退出中国了吗？

前期选上海小程序公司？测评逻辑与需求匹配指南

不想再当螺丝钉的打工人，开始琢磨一个人开公司了。

兆瓦级氢燃料航空涡桨发动机首飞成功

张文宏再谈AI：“灵魂”与“共情”无法被取代