当前位置: 首页 » 资讯 » 新科技 » 正文

全球中文大模型战力榜发布:前三被海外包揽 国产有惊喜

IP属地 中国·北京 编辑:胡颖 快科技 时间:2026-02-04 16:13:41

快科技2月4日消息,今天,SuperCLUE发布2025年年度中文大模型基准测评报告。

23个国内外模型参与角逐,覆盖数学推理、科学推理、代码生成等六大核心维度。

从结果来看,海外闭源模型依旧占据头部位置,Anthropic旗下的Claude-Opus-4.5-Reasoning以68.25分位居榜首。

谷歌的Gemini-3-Pro-Preview和OpenAI的GPT-5.2(high)分别以65.59分、64.32分紧随其后,包揽前三名。

不过,国产大模型正加速从跟跑向并跑迈进。国内开源最佳模型Kimi-K2.5-Thinking 和闭源最佳模型Qwen3-Max-Thinking,分别以61.50分、60.61分位列全球第四和第六。

在部分细分领域,国产模型表现亮眼,比如Kimi-K2.5-Thinking在代码生成任务中以53.33分夺冠,Qwen3-Max-Thinking在数学推理任务中与Gemini-3-Pro-Preview同获80.87分,并列全球第一。

从整体格局看,海内外开闭源模型差异显著。闭源阵营呈现海外领先、国产追赶态势,开源阵营则是国产主导、海外式微,国内开源模型Top5均大幅领先海外开源模型。

标签: 模型 国产 闭源 整体 代码生成 开源 全球中文 领先 阵营 谷歌 榜首 战力 维度 核心 基准 结果 数学 领域 细分 科学 任务 格局 头部 全球 态势 前三名 年度 中文 部分 差异 报告 紧随

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。