当前位置：首页 » 资讯 » 新科技 » 正文

腾讯混元OCR模型宣布开源参数仅为1B 多项核心能力达到SOTA效果

IP属地中国·北京 智通财经 时间：2025-11-25 16:20:32

智通财经APP获悉，11月25日，腾讯混元推出全新开源模型 HunyuanOCR，参数仅为1B，依托于混元原生多模态架构打造，获得多项业界OCR应用榜单SOTA(最先进水平)成绩。据介绍，HunyuanOCR 具有高度易用性，不仅体积小，便于部署，得益于混元原生多模态大模型“端到端”的理念设计，各项功能仅需单次前向推理即可直达最优结果，较业界级联方案更高效和便捷，性价比高。
混元OCR专家模型依托于混元原生多模态架构打造，主要由三大部分组建构成：原生分辨率视频编码器、自适应视觉适配器和轻量化混元语言模型。
不同于其他开源的OCR专家模型或系统，HunyuanOCR模型的训练和推理均采用全端到端范式，通过规模化的高质量应用导向数据，结合在线强化学习，模型表现出了非常稳健的端到端推理能力。
值得注意的是，混元OCR多项核心能力达到SOTA效果，其中在复杂文档解析的OmniDocBench测评中，获得了最高的94.1分，效果超过了谷歌的Gemini3-pro等一众领先的模型;文字检测和识别能力，在自建覆盖了9大应用场景(文档、艺术字、街景、手写、广告、票据、截屏、游戏、视频)的基准上，大幅度领先同类开源模型以及商业OCR模型;在OCRBench榜单上，总得分为860分，以仅仅1B总参数的模型配置，取得了包括通用视觉理解模型在内总参数3B以下的SOTA成绩。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

马斯克罕见公开道歉

科技周报｜Meta计划大规模裁员，马斯克称一周内启动超级芯片工厂

马斯克大刀阔斧调整xAI：裁员重建+重金挖角顶尖人才

马斯克罕见公开道歉

在闲鱼，他帮人抓住一只狂奔的“龙虾”

商家违规为电动汽车加装增程器：7千元续航可增加100公里

全站最新

马斯克罕见公开道歉

科技周报｜Meta计划大规模裁员，马斯克称一周内启动超级芯片工厂

马斯克大刀阔斧调整xAI：裁员重建+重金挖角顶尖人才

马斯克罕见公开道歉

热门推荐

马斯克罕见公开道歉

科技周报｜Meta计划大规模裁员，马斯克称一周内启动超级芯片工厂

马斯克大刀阔斧调整xAI：裁员重建+重金挖角顶尖人才

马斯克罕见公开道歉

在闲鱼，他帮人抓住一只狂奔的“龙虾”

商家违规为电动汽车加装增程器：7千元续航可增加100公里

上海推31项“新质要素”，涉及人形机器人、自动驾驶、商业航天等领域

苹果iPhone Fold曝光：拟采用侧边Touch ID与类iPad多任务交互

海信，一切都离不开创新二字

数智先行丨“全省首个”落户顺德，AI无人机治理跑出加速度

OpenAI开除内鬼！拿着改变世界的机密去赌博，一夜狂赚几十万

【数智周报】OpenClaw引发权威机构连续预警；腾讯云涨价，部分AI模型涨幅超400%；Anthropic起诉美国政府

上海推31项“新质要素”，涉及人形机器人、自动驾驶、商业航天等领域

研究警示：AI聊天机器人或加剧易感人群妄想思维

马斯克宣布特斯拉巨型AI芯片超级工厂“Terafab”七天内破土动工

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

腾讯混元OCR模型宣布开源参数仅为1B 多项核心能力达到SOTA效果

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

腾讯混元OCR模型宣布开源 参数仅为1B 多项核心能力达到SOTA效果

同类资讯

腾讯混元OCR模型宣布开源参数仅为1B 多项核心能力达到SOTA效果