当前位置：首页 » 资讯 » 新科技 » 正文

阿里国际发布多模态大模型 Ovis2.5，推动视觉感知与深度推理新进展

IP属地中国·北京 编辑：陆辰风 Chinaz 时间：2025-08-26 16:21:00

近日，阿里国际正式发布了其新一代多模态大模型 Ovis2.5，并对外开源。这款模型专注于原生分辨率视觉感知、深度推理以及高性价比的场景设计，旨在进一步提升人工智能的应用能力。Ovis2.5在主流多模态评测套件 OpenCompass 上的综合得分相比前一版本 Ovis2有了显著提升，继续在同类开源模型中保持 SOTA（最先进技术）水平。
此次发布的 Ovis2.5包含两个不同参数规模的版本。首先是 Ovis2.5-9B，这一版本在 OpenCompass 评测中获得了78.3的高分，超越了许多参数量更大的模型，并在40B 以下参数规模的开源模型中名列第一。其次，Ovis2.5-2B 的综合得分为73.9，延续了 Ovis 系列 “小身板、大能量” 的理念，特别适合端侧及资源受限的应用场景。
在 Ovis2.5的整体架构上，官方表示进行了系统性创新，主要体现在模型架构、训练策略与数据工程三个方面。模型架构方面，Ovis2.5延续了系列创新的结构化嵌入对齐设计，由三大核心组件构成:动态分辨率的视觉特征提取、视觉词表模块实现视觉与文本的结构对齐，以及以 Qwen3为基础的强大语言处理能力。
在训练策略上，Ovis2.5采用了更精细的五阶段训练方案，包括基础的视觉预训练、多模态预训练以及大规模的指令微调等多个步骤。同时，通过 DPO 和 GRPO 等算法加强偏好对齐和推理能力，有效提升了模型的性能。此外，模型的训练速度实现了3到4倍的端到端加速。
数据工程方面，Ovis2.5的数据量相比 Ovis2增加了50%，重点聚焦于视觉推理、图表、OCR（光学字符识别）和 Grounding 等关键领域。特别是合成了大量与 Qwen3深度适配的 “思考” 数据，极大地激发了模型的反思与推理潜能。
Ovis2.5的代码和模型均已在 GitHub 和 Hugging Face 等平台上线，用户可以通过这些平台获取相关资源，进一步探索其应用潜力。
代码:https://github.com/AIDC-AI/Ovis
模型: https://huggingface.co/AIDC-AI/
划重点:

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

全站最新

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

热门推荐

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

今夜过后，马斯克成为人类首位万亿富翁

萝卜快跑在瑞士启动道路测试 2027年将实现常态化运营

Anthropic：最先进模型，外国人禁用

网传阿里合伙人周靖人拟离职，仅出任阿里首席科学家6天

人物 | 陈宇森，那个让AI管人的技术极客，开启钉钉新时代

雷军用小米YU7装120箱车厘子共600斤，被指违规！刚刚直播回应：是卡车送过来的，是在封闭道路分装

湾区“造芯”更“追光”，粤芯闯关创业板

苹果为折叠屏iPhone Ultra铺路：iOS 27新增多款原生应用横屏模式

华为鸿蒙NEXT座舱发布计划公布，预计年底商用

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

专题

阿里国际发布多模态大模型 Ovis2.5，推动视觉感知与深度推理新进展

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

​阿里国际发布多模态大模型 Ovis2.5，推动视觉感知与深度推理新进展

同类资讯

阿里国际发布多模态大模型 Ovis2.5，推动视觉感知与深度推理新进展