当前位置：首页 » 资讯 » 新科技 » 正文

登顶AI智商基准测试：Claude Opus 4.6 强势超车 GPT-5.2

IP属地中国·北京 编辑：顾青青 Chinaz 时间：2026-02-09 16:31:14

大模型竞争格局再度洗牌。根据最新发布的 Artificial Analysis 智能指数，Anthropic 的旗舰模型Claude Opus4.6凭借卓越的表现力压群雄，正式登顶该权威排行榜。这一指数综合了编程、代理任务和科学推理等十项深度测试，Opus4.6在代理类工作任务、终端编程以及物理研究课题上均斩获第一。
值得关注的是，尽管 Opus4.6的运行成本高达2，486美元，略高于 OpenAIGPT-5.2的2，304美元，但在效率表现上却呈现出显著差异。数据显示，Opus4.6在测试过程中消耗了约5，800万个输出 Token，虽然这一数字是前代机型4.5的两倍，但相较于 GPT-5.2惊人的1.3亿个 Token，Opus4.6显然在信息密度和处理逻辑上更为精简。目前，该模型已全面上线Claude.ai平台，并支持通过 Google Vertex、AWS Bedrock 等主流云服务进行调用。
然而，Anthropic 的领先地位正面临严峻挑战。行业巨头 OpenAI 的新一代编程利器Codex5.3已在备测名单中。分析人士指出，一旦 Codex5.3完成所有基准测试，其在代码编写及相关逻辑领域的优势极有可能助其重夺王座。这场“全球最聪明模型”的拉锯战，远未到盖棺论定的时候。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

OPPO Pad mini轻薄小尺寸平板曝光

联想北美推新本，IdeaPad Pro 5i配置大升级

OPPO Find N6首销三日突破5.64万台，成单周热销榜唯一折叠旗舰

美媒记者使用谷歌Pixel手机致电白宫屏幕显示“爱泼斯坦岛”字样，谷歌回应

消息称极氪007 GT现款车型已售罄，焕新款二季度上市

韦德布什分析师大胆预测：特斯拉和SpaceX明年将合二为一

全站最新

OPPO Pad mini轻薄小尺寸平板曝光

联想北美推新本，IdeaPad Pro 5i配置大升级

OPPO Find N6首销三日突破5.64万台，成单周热销榜唯一折叠旗舰

美媒记者使用谷歌Pixel手机致电白宫屏幕显示“爱泼斯坦岛”字样，谷歌回应

热门推荐

OPPO Pad mini轻薄小尺寸平板曝光

联想北美推新本，IdeaPad Pro 5i配置大升级

OPPO Find N6首销三日突破5.64万台，成单周热销榜唯一折叠旗舰

美媒记者使用谷歌Pixel手机致电白宫屏幕显示“爱泼斯坦岛”字样，谷歌回应

消息称极氪007 GT现款车型已售罄，焕新款二季度上市

韦德布什分析师大胆预测：特斯拉和SpaceX明年将合二为一

反向名人效应：无聊公司隧道项目遇阻，居民一听马斯克姓名就反感

大疆做全景无人机，果然没打算只做个玩具

OpenAI视频大模型Sora突然关停专家：收入与成本严重倒挂

OpenAI逐步收缩成人内容等高风险消费级功能

打车被司机骂拉猪？官方：自导自演，博取流量

官方约谈多地政府负责人，督办315晚会曝光问题整改

“上海哪家小程序开发公司靠谱”16年的项目经理告诉您选外包商

融智聚力丨中建材信息亮相华为中国合作伙伴大会2026 获“杰出总经销商奖”

林俊旸从阿里离职后首发长文：复盘千问路线受阻，断言AI演进全面转向智能体

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

专题

登顶AI智商基准测试：Claude Opus 4.6 强势超车 GPT-5.2

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

​登顶AI智商基准测试：Claude Opus 4.6 强势超车 GPT-5.2

同类资讯

登顶AI智商基准测试：Claude Opus 4.6 强势超车 GPT-5.2