当前位置: 首页 » 资讯 » 新科技 » 正文

腾讯在世界人工智能大会发布混元3D世界模型等多项AI成果,展示AI应用全景图

IP属地 中国·北京 编辑:苏婉清 时间:2025-07-29 12:13:39

7月27日,在2025世界人工智能大会腾讯论坛上,腾讯携多项重磅AI成果震撼亮相。其中,混元3D世界模型1.0的正式发布并全面开源,以及具身智能平台Tairos(钛螺丝)的推出,尤为引人注目。与此同时,腾讯还首次展示了其面向AI时代的产品应用全景图,引发了行业内外的广泛关注。

腾讯混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术,支持文字和图片两种输入方式,能够生成高质量、风格多样且可漫游的3D场景。以往专业建模团队搭建一个3D虚拟世界可能需要数周时间,如今借助混元3D世界模型,用户只需输入一句文字描述或上传一张图片,短短几分钟内,一个完整的3D场景便能呈现。例如,游戏开发者输入“一座中世纪城堡,城堡塔楼宏伟壮阔,城堡周围是一座石头雕像,石头铺成的路以及美丽的花朵,卡通风格”的指令,模型迅速生成包含相应建筑、地形、植被的3D场景。生成的Mesh文件可直接用于游戏原型搭建、关卡设计,开发者还能灵活调整前景物体、更换天空背景,极大满足了个性化创作需求。对于没有建模经验的普通用户,通过混元3D创作引擎,仅需简单操作,就能快速生成360°沉浸式视觉空间,生成的场景可无缝导入Vision Pro等虚拟头显,带来身临其境的体验。

该模型的核心技术——“语意层次化3D场景表征及生成算法”,将复杂的3D世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离。不仅生成的整体场景视觉效果逼真,还能输出标准化的3D Mesh资产,可兼容Unity、Unreal Engine、Blender等主流工具。用户能对场景内元素进行独立编辑或开展物理仿真,成功将AIGC技术与传统CG工作流相衔接。与全球领先的开源模型相比,混元3D世界模型1.0在文生世界、图生世界的美学质量和指令遵循能力等关键维度上,全面超越当前SOTA的开源模型。

此次大会上,腾讯旗下的Robotics X实验室与福田实验室联合发布的具身智能开放平台Tairos(钛螺丝)同样备受瞩目。Tairos是国内首个以模块化方式,为机器人本体开发商与应用开发商提供大模型、开发工具和数据服务的具身智能软件平台,通过即插即用的形式面向机器人行业开放。腾讯首席科学家、RoboticsX实验室主任、福田实验室主任张正友表示,Tairos具身智能平台旨在为各类机器人装上“大脑”,赋予机器人感知世界、规划任务以及自主决策等能力,推动机器人从被动执行指令的机械体,进化为主动适应现实世界的智能生命体。

除了上述两项重大成果,腾讯还带来了智能体开发平台等产品的全新升级,并首次展示了其“1+3+N”的AI应用全景体系。该体系以腾讯自研混元大模型为核心引擎,构建起涵盖平台能力与多元应用的完整架构。其中,“1”代表混元大模型;“3”涵盖面向B、C端的智能体开发平台,面向机器人领域的腾讯具身智能开放平台,以及AIGC内容生成平台、端侧大模型平台、AI教育平台等;“N”则表示分布在多个行业场景中的丰富AI应用与智能体产品矩阵。通过这一体系,腾讯正加速推动AI从技术突破迈向场景落地,致力于打造真正“好用的AI”。

在混元大模型方面,其迭代速度不断加快。混元旗舰模型Turbo S自年初发布后,保持每月一个版本的快速更新,在代码、理科能力和复杂指令遵循等方面显著提升,在全球大模型权威排行榜上成绩优异。混元T1基于TurboS基座进一步提升推理能力,综合能力在国内领先。端到端语音模型混元Voice、多模态理解模型混元Vision基于混元大语言模型基座打造,多模态理解能力出色,在LMArena Vision全球大模型权威榜单中,混元在中文能力方面位居全球第一梯队。在多模态生成方面,混元具备超高速生成高清图的实时生图能力、人物一致性可控的视频生成能力,3D生成能力更是处于全球领先水平,最新混元3D2.5模型质感大幅提升。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。