当前位置: 首页 » 资讯 » 新科技 » 正文

vivo 新多模态模型登场,AI 理解GUI界面能力再升级!

IP属地 中国·北京 编辑:顾雨柔 Chinaz 时间:2025-07-10 18:34:06

近日,vivo AI Lab 发布了其最新的端侧多模态模型 ——BlueLM-2.5-3B。这款模型不仅小巧高效,更具备了理解图形用户界面(GUI)的能力,标志着人工智能在处理文本和图像方面迈出了重要一步。

BlueLM-2.5-3B 的独特之处在于它可以灵活切换长短思考模式,并引入了思考预算控制机制,帮助 AI 更好地平衡思考的深度与效率。这使得该模型在多项文本和多模态评测任务中表现优异,尤其在理解和推理方面,有望超过许多同类产品。

在20余项评测中,BlueLM-2.5-3B 显示出了强大的文本处理能力,成功缓解了多模态模型常见的 “遗忘问题”。在长思考模式下,模型在推理类任务中,如数学和逻辑推理,的表现显著优于其他同规模的模型。此外,其在多模态理解方面也表现不俗,能够与更大规模的模型媲美,体现了它的强大。

不仅如此,BlueLM-2.5-3B 在理解 GUI 方面的表现尤为突出,得益于对大量中文应用程序截屏数据的训练。在这方面,它的得分超过了许多竞争对手,展示了 vivo 在人工智能领域的实力。

为了支撑如此出色的表现,BlueLM-2.5-3B 采用了精巧的模型结构,参数量仅为2.9B,且训练和推理成本相对较低。通过优化的数据利用策略和高效的训练流程,该模型在数据利用效率上有了显著提升,为 AI 的普及和应用打下了坚实的基础。

BlueLM-2.5-3B 的发布不仅为用户带来了更加智能的应用体验,也为人工智能技术的进步增添了新的动力。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。