当前位置: 首页 » 资讯 » 新科技 » 正文

DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限

IP属地 中国·北京 编辑:刘敏 快科技 时间:2025-10-21 10:06:20

快科技10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。

据介绍,DeepSeek-OCR的参数量约为3B,是研究团队对“光学二维映射压缩”技术在长文本上下文处理中可行性的首次探索。

该模型核心由DeepEncoder与DeepSeek3B-MoE-A570M解码器构成:DeepEncoder能够在高分辨率输入条件下保持低激活状态,实现高压缩比并生成适量的视觉token;解码器则负责将这些视觉token准确转化为文本信息。

实验数据显示,当文本token数量控制在视觉token的10倍以内(压缩率<10 x )时,OCR识别精度可达97%;即使压缩率提升至20×,模型准确率仍能维持在60%左右。

研究团队表示,这一成果为长上下文压缩技术以及大语言模型的记忆与遗忘机制研究提供了新的思路与方向。

标签: 文本 模型 精度 记忆 开源 消息 团队 高分辨率 方向 媒体报道 光学 条件 思路 视觉 语言 技术 数据 数量 信息 解码器 机制 研究成果 据介绍 核心 准确率 科技 可行性

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。