当前位置：首页 » 资讯 » 新科技 » 正文

DeepSeek-VL2 开源：AI视觉模型迈入 MoE 时代

IP属地中国·北京 编辑：钟景轩 IT之家 时间：2024-12-14 10:52:24

12 月 14 日消息，DeepSeek 官方公众号昨日（12 月 13 日）发布博文，宣布开源 DeepSeek-VL2 模型，在各项评测指标上均取得了极具优势的成绩，官方称其视觉模型正式迈入混合专家模型（Mixture of Experts，简称 MoE）时代。
援引官方新闻稿，附上 DeepSeek-VL2 亮点如下：

数据：比一代 DeepSeek-VL 多一倍优质训练数据，引入梗图理解、视觉定位、视觉故事生成等新能力

架构：视觉部分使用切图策略支持动态分辨率图像，语言部分采用 MoE 架构低成本高性能

训练：继承 DeepSeek-VL 的三阶段训练流程，同时通过负载均衡适配图像切片数量不定的困难，对图像和文本数据使用不同流水并行策略，对 MoE 语言模型引入专家并行，实现高效训练
DeepSeek-VL2 模型支持动态分辨率，仅使用一个 SigLIP-SO400M 作为图像编码器，通过将图像切分为多张子图和一张全局缩略图来实现动态分辨率图像支持。这一策略让 DeepSeek-VL2 最多支持 1152x1152 的分辨率和 1:9 或 9:1 的极端长宽比，适配更多应用场景。
DeepSeek-VL2 模型还得益于更多科研文档数据的学习，可以轻松理解各种科研图表，并通过 Plot2Code，根据图像生成 Python 代码。
模型和论文均已发布：
模型下载：https://huggingface.co/deepseek-ai
GitHub 主页：https://github.com/deepseek-ai/DeepSeek-VL2

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

上海电信回应罗永浩网速慢投诉

罗永浩被大金空调售后整破防：清洗需要1.5万，抠个滤网收283元

字节跳动全年利润500亿美元？知情人士回应

vivo X200T手机规格曝光：天玑9400+芯片，5000万主摄

微软商城Surface独家好价，支付宝付款额外补贴、至高优惠6000+

围墙倒塌前夜：iOS 与 Android 迎来“世纪大和解”

全站最新

上海电信回应罗永浩网速慢投诉

罗永浩被大金空调售后整破防：清洗需要1.5万，抠个滤网收283元

字节跳动全年利润500亿美元？知情人士回应

vivo X200T手机规格曝光：天玑9400+芯片，5000万主摄

热门推荐

上海电信回应罗永浩网速慢投诉

罗永浩被大金空调售后整破防：清洗需要1.5万，抠个滤网收283元

字节跳动全年利润500亿美元？知情人士回应

罗永浩锤子软件在上海成立分公司

一加Turbo系列电池突破9000mAh 李杰：强得可怕

全球大模型第一股要来了智谱发布IPO招股书：代码能力并列全球第一

行业唯一阔折叠！华为Pura X最高优惠800元：6899元起

vivo X200T手机规格曝光：天玑9400+芯片，5000万主摄

微软商城Surface独家好价，支付宝付款额外补贴、至高优惠6000+

《互联网平台价格行为规则》印发

围墙倒塌前夜：iOS 与 Android 迎来“世纪大和解”

阿里字节腾讯的CEO身旁都有了一个AI科学家

《互联网平台价格行为规则》印发

《互联网平台价格行为规则》印发：不得以低于成本的价格销售商品或者提供服务，扰乱市场竞争秩序

AI处理简历、智能体面试，未来人力资源科技在这场大会上“扎堆儿”

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

DeepSeek-VL2 开源：AI视觉模型迈入 MoE 时代