当前位置: 首页 » 资讯 » 新科技 » 正文

小钢炮4.0视觉模型MiniCPM-V 4.0,手机端应用更流畅

IP属地 中国·北京 编辑:钟景轩 Chinaz 时间:2025-08-11 12:32:04

在人工智能的持续发展中,最近一款新模型 MiniCPM-V4.0引起了广泛关注。该模型是 MiniCPM-V 系列的最新版本,具有4.1亿参数,基于 SigLIP2-400M 和 MiniCPM4-3B 进行构建。与之前的版本相比,MiniCPM-V4.0在单图、多图及视频理解方面表现出色,并且在效率上有了显著提升。

MiniCPM-V4.0以其强大的视觉能力而自豪。在众多评测基准中,该模型在 OpenCompass 的综合评估中取得了69.0的平均分,超越了 GPT-4.1-mini-20250414、MiniCPM-V2.6(8.1亿参数,得分65.2)和 Qwen2.5-VL-3B-Instruct(3.8亿参数,得分64.5)。在多图理解和视频理解领域,它也展现了良好的性能。

针对移动设备的设计是 MiniCPM-V4.0的一大亮点。该模型在 iPhone16Pro Max 上运行顺畅,首次响应延迟不到2秒,解码速度超过每秒17个 token,且没有发热问题。即便在高并发请求下,它也表现出优越的吞吐能力。

为了让更多用户轻松上手,MiniCPM-V4.0提供了多种使用方式,包括与多种平台兼容的工具,如 llama.cpp、Ollama、vLLM 等。为了更好地服务用户,开发团队还开源了一款可以在 iPhone 和 iPad 上运行的 iOS 应用,帮助用户轻松上手。配套的 Cookbook 也提供了详细的使用指南和实用示例,进一步简化了操作过程。

项目:https://huggingface.co/openbmb/MiniCPM-V-4

划重点:

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。