![]()
大晓机器人近日开源开悟世界模型3.0(Kairos 3.0)-4B系列具身原生世界模型,作为业内首个实现“多模态理解—生成—预测”一体化的开源具身原生世界模型,Kairos 3.0-4B以六大核心优势,打破行业瓶颈,推动具身智能从“行为模仿”向“物理级深度理解”跨越,为规模化落地提供核心引擎。
当前,具身智能行业深陷数据稀缺割裂、长时序交互不足、部署成本高昂等困境,传统生成式模型多为“大模型改款”,缺乏对物理世界的深度认知。而Kairos 3.0-4B从架构底层重构设计,以自然界物理规律与因果规律为根基,融合机器人真机交互、人类行为结构化与思维链文本三类关键数据,打破多元数据壁垒,实现了“理解世界、生成世界、预测世界”的一体化能力,让模型真正做到“知其然更知其所以然”。
![]()
作为全球首个可端侧驱动具身智能本体控制的世界模型,Kairos 3.0-4B在部署与执行能力上实现重大突破。该模型部署于Jetson Thor T5000端侧平台,算力可达517 TFLOPS,是行业内首个在THOR端侧平台达成1:1.5(视频生成时间:视频时长)实时生成的具身世界模型。依托端侧部署优势,模型可直接输出机器人全身体控制指令,省去中间转译环节,不仅能在3D仿真环境中精准规划机械臂运动轨迹,更能实现机器人本体的真实驱动与作业执行,让机器人真正从“会表演”走向“能干活”。
物理因果一致性是具身智能的核心竞争力,Kairos 3.0-4B在该领域全面领先全球主流模型。在倒水、叠平衡石等复杂物理交互场景中,模型能精准复现物理规律:倒水时水流平稳、液体总量符合水杯容量,完全遵循质量守恒与流体动力学;叠平衡石时严格遵循重力与支撑结构规律,无悬浮、刚性丧失等异常。相比之下,Cosmos 2.5、Lingbot等竞品均出现物理逻辑失真问题,凸显了Kairos 3.0-4B的技术硬实力。
![]()
长时序交互能力的突破的为具身智能落地开辟新路径。Kairos 3.0-4B结合Agent智能体技术,可将复杂交互指令层级拆解,通过精细化预测与自我反思机制,生成长达7分钟的连贯具身动态交互视频。在家庭场景Demo中,机器人可一镜到底完成整理桌面、衣物清洗、早餐制备等全流程自主作业,无断点、高保真地展现了动态交互、物体识别与多场景规划能力,验证了其在家庭服务、工业制造等领域的应用潜力。
轻量化与高效能的结合,让Kairos 3.0-4B打破“大参数=高性能”的行业固有认知。该模型以4B轻量化参数实现23.5GB显存占用,远低于同类竞品,完美适配端侧实时推理需求。在A800 GPU Benchmark评测中,其推理速度较Cosmos 2.5提升72倍,完成10秒生成任务仅耗时9.5秒,较Lingbot快约151倍;同时率先实现云侧1:1实时推理,适配英伟达、沐曦等多款GPU,大幅降低部署门槛。
多本体泛化能力则破解了传统具身模型“一本体一训练”的痛点。Kairos 3.0-4B支持跨本体任务一键生成,可无缝适配单臂、双臂、灵巧手等不同形态机器人,无需额外训练即可生成适配执行策略,同时深度支持智元-精灵G1、宇树G1等主流机器人硬件,打破设备本体壁垒。
![]()
权威评测进一步印证了Kairos 3.0-4B的综合实力。
在PAI-Bench-robot、WorldModelBench-robot TI2V、DreamGen Bench三项全球权威Benchmark中,该模型均斩获第一:PAI-Bench-robot以80.03分领跑,WorldModelBench-robot TI2V以9.08分超越所有竞品,DreamGen Bench中物理对齐(PA)与交互保真(IF)指标均全面领先,其中PA得分较阿里Wan 2.2-5B提升近70%。
作为中国自研的具身原生世界模型,Kairos 3.0-4B不仅可作为高效数据仿真器,低成本放大训练数据体量,破解真机数据稀缺难题,更能直接驱动机器人完成实体任务,打通虚拟仿真到物理执行的全链路。此次开源将进一步推动技术普及与生态共建,为具身智能在工业、家庭、安防等多领域规模化落地提供核心支撑,也为全球具身智能行业发展贡献领先的中国方案。





京公网安备 11011402013531号