科技日报
科技日报记者 马爱平
弯肘、抬臂、向前抓取……在江苏箸境智能科技有限公司(以下简称“箸境智能”)的采集室内,工作人员屏幕前的每一个基础动作,都同步映射为机器人的精准动作,进而转化为一条条包含视频、关节角度与力矩等信息的结构化数据。
近日,由箸境智能上架的“具身智能数据集”在江苏省数据交易所完成交易,实现全国该领域零的突破。
具身智能数据集是为训练与评估具身智能系统而构建的多模态数据集合,专门记录智能体如机器人在物理或虚拟环境中通过“身体”与环境交互的全过程数据,用于提升其感知、决策、执行与反馈能力。
“高质量数据产品正成为市场竞逐的焦点,这类数据集具备鲜明的‘三高’特征,即高价值应用、高知识密度与高技术含量。”江苏省数据交易所相关负责人表示,此类数据集不仅是模型迭代的核心燃料,更是AI技术与实体经济深度融合不可或缺的基础性支撑,在市场中日益受到高度关注与迫切需求。
据了解,此次完成交易的具身智能数据集,包含约2.5万条结构化数据,覆盖办公、商超、餐饮、家政四大场景。每条数据时长约10秒,容量从几十兆到上百兆字节不等,不仅包含机器人“视角”的实时画面,还完整记录了执行过程中各关节的电流、角度、力矩等参数,并附带任务指令,结构清晰,可直接用于模型训练。
“机器人每完成一次任务,就产生一笔数据。而机器人训练对数据的需求极大,通常需达到数万条规模。数据量越大、覆盖场景越全,模型的执行精度就越高。”箸境智能技术员王煊介绍。
如果企业通过直接采购,获得的将是一套经过深度清洗、严密标注且可直接投入模型训练的基础动作体感数据信息。“这不仅省去了从零搭建采集环境、反复调试数据质量的漫长周期,更显著降低了自行探索中的试错成本与不确定性,从而能够以更高起点、更快速度推进AI模型在复杂真实环境中的认知与执行能力迭代。”王煊进一步解释。
“目前,从全球范围内来看,具身智能数据集仍是机器人产业发展的关键短板。”国家地方共建人形机器人创新中心首席科学家江磊表示。
面对这一挑战,国家数据发展研究院院长胡坚波透露,我国正按照“1+3+5+N”的思路,依托1个高质量数据集管理服务平台,从3个层次推进高质量数据集基础设施化,通过5类建设主体,以N个典型应用场景为牵引,聚焦重点行业领域和创新领域,建设高质量数据集,服务人工智能模型开发和应用。本次上架的“具身智能数据集”正是由企业作为建设主体,以具身智能典型应用场景为牵引打造的高质量数据集。





京公网安备 11011402013531号