当前位置：首页 » 资讯 » 新科技 » 正文

阿里千问夺冠，GPT-5垫底，全球首个AI投资大赛落幕

IP属地中国·北京 雷峰网 时间：2025-11-04 18:16:41

11月4日，备受关注的AI大模型实时投资比赛“Alpha Arena”落下帷幕，阿里千问Qwen夺下最终的冠军。该竞赛由三方机构Nof1于10月18日发起，集合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大顶尖模型，每个模型拥有一万美元初始资金，在真实市场上无人工干预地自主决策、交易，根据盈亏情况决出最后冠军。历时17天，阿里千问Qwen以超20%的收益率夺得最后的冠军，Qwen和DeepSeek两款中国模型也成为唯二盈利的模型，而四大美国顶尖模型全部亏损，GPT-5亏损超60%垫底。

AI大模型在各种性能基准榜单中屡创新高，如何评估大模型在真实、动态、竞争激烈的环境中的决策水平，是当下AI竞技场最受人关注的领域。美国人工智能研究实验室 nof1.ai 发布的“Alpha Arena”（阿尔法竞技场），向六大顶尖模型提供1万美元及金融市场的实时价格及各类指标数据，让大模型在真实市场中用真金白银进行投资比赛，全程没有人工干预，模型进行自主决策和交易，是AI处理实时变动的现实世界任务的真实评测，也因此成为近期最火热的AI大赛。
比赛初期，六大模型相对谨慎，大约5天后，参赛模型大致分为三大阵营：阿里千问和DeepSeek成功领先，屡次互换第一，始终位列第一梯队；Claude Sonnet 4.5和Grok4在相近策略驱动下，维持在第二阵营，略有盈利，整体仍亏损；GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。

截至北京时间11月4日早上比赛结束，阿里千问凭借在关键时刻的紧急避险，最后关头超越DeepSeek，Qwen以超20%的胜率问鼎冠军；DeepSeek实现盈利，位列第二，两大中国模型成为唯二仍保持正收益的大模型；Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大海外模型均亏损，Gemini 2.5 pro和GPT-5亏损尤为明显，截至最终持仓总市值仅为初始资金的三四成。
赛事主办方Alpha Arena的创办人Jay Azhang多次为阿里千问Qwen模型策略及表现点赞，并祝贺阿里千问最终赢得冠军。有业内专家指出，阿里千问和DeepSeek在实战中的优秀表现，证明了中国模型在解决实际问题的强大潜力，AI对于场景的深刻理解，将成为大模型落地和未来全球AI竞赛的关键。
比赛链接：https://nof1.ai/

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

乔治亚理工学院研究团队让机器学习过程变得更快更稳定

突发！巨头退市！

阿联酋学者:让汤姆和杰瑞走进现实，与憨豆先生同台演出不再是梦

中国顶尖科学家数量已超越美国

他发明了价值万亿的AGI，如今穷困潦倒

数字员工上岗总卡壳？腾讯 “数字总部”开放内测，让AI Agent真正跑起来

全站最新

乔治亚理工学院研究团队让机器学习过程变得更快更稳定

突发！巨头退市！

阿联酋学者:让汤姆和杰瑞走进现实，与憨豆先生同台演出不再是梦

中国顶尖科学家数量已超越美国

热门推荐

乔治亚理工学院研究团队让机器学习过程变得更快更稳定

突发！巨头退市！

“光+AI”推动光子产业进一步生态聚变 2025硬科技创新大会光子产业高峰会议在西安举行

阿联酋学者:让汤姆和杰瑞走进现实，与憨豆先生同台演出不再是梦

中国顶尖科学家数量已超越美国

他发明了价值万亿的AGI，如今穷困潦倒

数字员工上岗总卡壳？腾讯 “数字总部”开放内测，让AI Agent真正跑起来

又一AI独角兽拿下8亿融资，估值250亿，谷歌英伟达都投了

广州白云机场起飞！国内首架C919全运会主题彩绘机首航

Akamai牵手英伟达，推出AI边缘云，释放了什么行业信号？

英伟达与德国电信宣布投资10亿欧元在德建数据中心

最高测程950 米！大疆发布航测激光雷达禅思 L3，全面布局高端航测雷达市场

21独家｜小鹏上周重启Robotaxi项目，内部转岗进行时

京东双11手机榜：苹果登顶销冠，小米摘国产第一

英伟达(NVDA.US)推进欧洲AI业务：联手德国电信在德投建10亿欧元数据中心