当前位置: 首页 » 资讯 » 新科技 » 正文

Qwen3-VL登顶SpatialBench:空间推理13. 5 分刷新SOTA,3D检测能力再升级

IP属地 中国·北京 编辑:苏婉清 Chinaz 时间:2025-11-26 18:23:39

阿里千问视觉模型在第三方空间推理榜单SpatialBench夺得前两名:Qwen3-VL13.5分、Qwen2.5-VL12.9分,大幅领先Gemini3.0Pro Preview(9.6分)与GPT-5.1(7.5分),距离人类基线80分再近一步。

榜单特点

SpatialBench专注2D/3D空间、结构、路径推理,含电路分析、CAD工程、分子生物学等复杂任务,被视为“具身智能试金石”。

模型亮点

-3D检测升级:Qwen3-VL新增旋转框输出与深度估计头,遮挡场景AP↑18%,可判断物体方位、视角变化

- 视觉编程:输入草图或10秒短视频即可生成可运行Python+OpenCV代码,实现“所见即所得”

- 规模多样:提供2B/4B/8B/32B密集模型及30B-A3B、235B-A22B MoE版本,推理版在32项核心能力测试中平均超越Gemini2.5-Pro6.4分

开源节奏

Qwen2.5-VL已全量开源;Qwen3-VL预计2025年Q2释放权重与工具链,同步上线千问App免费体验。

落地进展

阿里云透露,Qwen3-VL已在物流机器人、AR装配、智慧港口等场景POC,空间定位误差<2cm,2026年将推出“视觉-动作”端到端模型,为机器人提供实时视觉伺服能力。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新