当前位置: 首页 » 资讯 » 新科技 » 正文

商汤开源多模态自主推理模型SenseNova-MARS,支持调用多种工具

IP属地 中国·北京 编辑:吴婷 凤凰网科技 时间:2026-01-30 12:09:16

1月30日,商汤科技宣布开源其多模态自主推理模型SenseNova-MARS,提供8B与32B两个参数版本。据官方信息,该模型在多模态搜索与推理的基准测试中综合得分69.74,超过Gemini-3-Pro与GPT-5.2等模型。

该模型被定位为Agentic VLM(视觉语言模型),支持动态规划步骤与调用多种工具,让AI真正具备“执行能力”。

SenseNova-MARS的应用场景包括从图片中识别微小标志、搜索关联信息并进行多步骤推理。例如,可自主调用图像裁剪、文本与图像搜索工具,完成识别赛车服logo、查询公司背景等复合任务。

在训练方法上,模型采用了自动化数据合成构建复杂推理链路,并结合强化学习进行优化。技术细节已发布在相关论文中,开发者可获取模型进行测试与使用。

标签: 模型 工具 模态 开源 信息 商汤 官方 标志 步骤 任务 公司 推理模型 版本 图片 动态 开发者 背景 科技 关联 文本 训练方法 语言 图像 视觉 参数 规划 赛车服 场景 论文 凤凰网 定位

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新