当前位置: 首页 » 资讯 » 新科技 » 正文

​登顶AI智商基准测试:Claude Opus 4.6 强势超车 GPT-5.2

IP属地 中国·北京 编辑:顾青青 Chinaz 时间:2026-02-09 16:31:14

大模型竞争格局再度洗牌。根据最新发布的 Artificial Analysis 智能指数,Anthropic 的旗舰模型Claude Opus4.6凭借卓越的表现力压群雄,正式登顶该权威排行榜。这一指数综合了编程、代理任务和科学推理等十项深度测试,Opus4.6在代理类工作任务、终端编程以及物理研究课题上均斩获第一。

值得关注的是,尽管 Opus4.6的运行成本高达2,486美元,略高于 OpenAIGPT-5.2的2,304美元,但在效率表现上却呈现出显著差异。数据显示,Opus4.6在测试过程中消耗了约5,800万个输出 Token,虽然这一数字是前代机型4.5的两倍,但相较于 GPT-5.2惊人的1.3亿个 Token,Opus4.6显然在信息密度和处理逻辑上更为精简。目前,该模型已全面上线Claude.ai平台,并支持通过 Google Vertex、AWS Bedrock 等主流云服务进行调用。

然而,Anthropic 的领先地位正面临严峻挑战。行业巨头 OpenAI 的新一代编程利器Codex5.3已在备测名单中。分析人士指出,一旦 Codex5.3完成所有基准测试,其在代码编写及相关逻辑领域的优势极有可能助其重夺王座。这场“全球最聪明模型”的拉锯战,远未到盖棺论定的时候。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。