继文本、图像、视频之后,AI的下一前沿——空间大模型——迎来关键破局者。魔芯科技,一家在3D AIGC领域拥有深厚积累的公司,在25年底和华为一起发布了其自研世界模型KOKONI-World,凭借在长时域记忆和实时交互上的突破,确立了其在空间大模型赛道的领先玩家地位。
人工智能的进化正从二维平面走向三维空间,空间智能(Spatial Intelligence)已悄然成为定义下一代AI交互的核心赛道。在2025年12月18日,魔芯科技携手华为,在“华为昇腾云技术交流会暨魔芯科技空间智能模型产品发布会”上,凭借其发布的自研世界模型KOKONI-World,正式宣告自己已成为这一前沿领域的领先玩家。
魔芯科技并非AI新秀,其在消费级3D打印和3D AIGC(三维内容生成)领域早已声名显赫。此次战略转型,是其技术路线的自然演进和前瞻布局。从生成静态的“3D物体”,到创造动态的“3D/4D世界”,魔芯科技旨在构建能够理解物理规律、实现空间推理的通用智能基础。
“空间大模型是物理世界与数字智能的桥梁,”魔芯科技创始人陈天润表示,“我们过去积累的所有关于三维几何、材质、光影的知识,都成为了今天构建KOKONI-World的基石。”
魔芯科技世界模型成果的发布,是魔芯科技作为国产空间大模型领先玩家的实力宣言,不论是在场景记忆的时长、输出视觉的分辨率和一致性、可控性等学术指标上,均领先于如谷歌Genie-3,腾讯混元WorldPlay等当前头部的模型,具体而言:
分钟级时空连贯性:基于华为昇腾910C的超大显存和针对性的并行策略和融合算子等工程优化,魔芯科技的模型原生训练了长达2分钟以上的场景记忆,解决了空间智能中最棘手的“记忆一致性”难题,用户可以进行任意的漫游和“回头”。
精确相机控制和文本控制:模型创新性地将历史视觉信息与相机位姿进行联合编码,构建了一套"相机感知"的长时域记忆系统。该系统能够根据当前视角智能检索相关的历史场景信息,确保用户在大范围探索后返回时,场景的几何结构与视觉细节保持高度一致。基于多卡的硬件特点,精心设计了多prompt渐进注入分片后模型的机制,实现实时根据用户想法触发新的内容生成的功能。
游戏级实时交互:基于华为昇腾910C和Matrix384超节点的超大互联带宽下,魔芯科技的世界模型可以让用户在1080p高清分辨率下,像玩3A游戏一样,通过6自由度相机控制,用鼠标、键盘或是手指,在生成的虚拟世界中自由探索,所有操作都得到即时、流畅的视觉反馈,并且支持随着生成过程修改画面内容。
魔芯科技的世界模型生成的相机可控的4D内容
这一系列技术突破,使魔芯科技不仅在如WorldScore等学术指标上超越了同类模型,更在“可交互性”和“沉浸感”这两个核心体验上,将空间大模型的实用价值推向了全新高度。据悉,魔芯科技已经在客户场景中,推动世界模型的产业落地。凭借近期完成的数亿元融资,魔芯科技将继续巩固其在空间智能领域的领先优势,加速推动该技术在机器人、自动驾驶、数字孪生、数字文旅等场景的商业化落地。





京公网安备 11011402013531号