当前位置：首页 » 资讯 » 新科技 » 正文

智谱宣布开源视觉推理模型GLM-4.5V正式上线并开源

IP属地中国·北京 编辑：李娜凤凰网科技 时间：2025-08-11 22:23:40

8月11日，智谱AI推出全球100B级效果最佳的开源视觉推理模型 GLM-4.5V（总参数 106B，激活参数 12B），并同步在魔搭社区与Hugging Face开源。此外，API调用价格低至输入2元/M tokens，输出6元/M tokens。
GLM-4.5V基于智谱新一代旗舰文本基座模型GLM-4.5-Air，延续GLM-4.1V-Thinking 技术路线，在41个公开视觉多模态榜单中综合效果达到同级别开源模型SOTA性能，涵盖图像、视频、文档理解以及GUI Agent等常见任务。比如，GLM-4.5V能够根据用户提问，精准识别、分析、定位目标物体并输出其坐标框。
据介绍，多模态推理被视为通向通用人工智能（AGI）的关键能力之一，让AI能够像人类一样综合感知、理解与决策。其中，视觉-语言模型（Vision-Language Model, VLM）是实现多模态推理的核心基础。

标签： glm 智谱模态视觉 ai 模型旗舰 人工智能

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

打破人类距离地球最远飞行纪录

千问三连发，阿里ATH加速让Token流向物理世界

大模型SFT后效果≠RL潜力！港科大、阿里提出自适应冷启动新范式

估值8520亿美元却主动要求被征税：OpenAI发布的13页白皮书到底在说什么？

小红书种草核心：用场景化渗透建信任，以用户影响扩口碑，实现心智深度连接

学长学姐教学弟学妹，杭电办前端开发“AI+”训练营

全站最新

打破人类距离地球最远飞行纪录

千问三连发，阿里ATH加速让Token流向物理世界

大模型SFT后效果≠RL潜力！港科大、阿里提出自适应冷启动新范式

估值8520亿美元却主动要求被征税：OpenAI发布的13页白皮书到底在说什么？

热门推荐

打破人类距离地球最远飞行纪录

千问三连发，阿里ATH加速让Token流向物理世界

大模型SFT后效果≠RL潜力！港科大、阿里提出自适应冷启动新范式

估值8520亿美元却主动要求被征税：OpenAI发布的13页白皮书到底在说什么？

小红书种草核心：用场景化渗透建信任，以用户影响扩口碑，实现心智深度连接

学长学姐教学弟学妹，杭电办前端开发“AI+”训练营

成都小程序开发服务商

江西联通工业互联网研究院与镝铒智能共商合作

雷军、马云罕见联手！千寻智能30天累计融资30亿

OpenClaw进高速！百度智能云要做什么？

腾讯AI还有一张暗牌

从屏蔽竞品，到限制大模型，互联网大厂间是如何商战的？

京东开源图像模型JoyAI-Image-Edit，空间编辑与理解能力达到世界一流水平

源杰半导体冲刺港股：年营收6亿利润1.9亿市值超900亿

以材料之深度，拓应用之广度，上善院这样书写“硬核”答卷