![]()
新智元报道
编辑:艾伦
在Alpha Arena 1.5赛季的美股真金白银实盘中,Grok 4.20完胜GPT-5.1和Gemini 3.0 Pro等一众顶流模型,在对手全线亏损的情况下,独自斩获了12.11%的正收益。成功背后的秘密是Grok对X的推文反映的市场情绪的及时精准捕捉。
就在昨天,金融圈和AI圈同时炸了锅。
在nof1.ai举办的Alpha Arena 1.5赛季中,那个代号为「Mystery Model」(神秘模型)的幽灵选手终于揭开了面纱。
它是来自xAI的Grok 4.20。
在为期两周的比赛里,它把手里1万美元的本金变成了12193美元,结算成绩时综合回报率12.11%。
![]()
成绩已结算(限时两周),但模型炒股仍在运行中
这听起来似乎不多?
但在同样的市场环境下,那些被吹上天的GPT-5.1、Gemini 3.0 Pro和Claude Sonnet 4.5,全部亏损。
这是真金白银的华尔街大逃杀。
Grok 4.20不仅赢了,还把对手的脸按在地上摩擦。
赛博斗兽场:Alpha Arena
这是由nof1实验室打造的一个「全自动金融角斗场」。
规则很简单:给每个顶尖大模型1万美元真钱,扔进残酷的美国股市,不准人类插手,让它们自己决定买什么、卖什么,甚至何时加杠杆。
在这个1.5赛季,战场从狂野的加密货币转移到了更为老练的美股市场。
为了增加难度,主办方还设计了四种变态模式,包括不仅要赚钱还要极度克制的「苦行僧模式」,以及允许查看对手底牌的「情境感知模式」。
一场单方面的屠杀
比赛结果出来时,数据尴尬得让人想替其他大厂找个地缝钻进去。
当OpenAI的GPT-5.1还在犹豫不决(剩下9737美元)时;
当谷歌的Gemini 3.0 Pro因为操作失误巨亏近30%(剩下7382美元)时;
Grok 4.20却像个老练的华尔街赌徒,冷静地收割着利润。
最讽刺的是上一代Grok 4也参赛了,结果垫底,亏得只剩4610美元。
这恰恰证明了xAI在版本迭代上的惊人飞跃——从「韭菜」进化成「镰刀」,马斯克只用了一个版本号。
它凭什么赢?
Grok 4.20的胜出,或许早已注定。
有分析指出,与其他只能通过普通联网搜索新闻的模型不同,Grok拥有一个核武器级别的优势:它可以实时访问X的完整数据流。
在股市里,情绪就是金钱。
当其他AI还在啃枯燥的财报时,Grok可能已经通过分析推特上的数百万条推文,嗅到了散户对Palantir(PLTR)公司股票的狂热。
事实也证明了这一点。在比赛的「苦行僧模式」中,Grok 4.20极其嚣张地对PLTR开了10倍杠杆。
理由?它捕捉到了「AI叙事」的宏观利好。
这笔交易直接为它带来了465美元的浮盈。
而在另一个战场,它稳稳拿住了微软(MSFT)和代号XYZ100的仓位,即使市场震荡也纹丝不动,展现出了惊人的定力。
更可怕的是在「情境感知模式」下,Grok 4.20一度拿下了近50%的收益。
这个模式允许选手看到对手的持仓。
Grok不仅读懂了市场,还读懂了对手。
它预判了GPT的预判,这才是最令人细思极恐的地方。
马斯克揭晓谜底
胜利之后,马斯克自然不会放过这个炫耀的机会。
他在X上得意地确认了Grok 4.20的身份。
![]()
https://x.com/elonmusk/status/1996823776340988025
如果一个4.20版本已经能把其他顶尖AI杀得片甲不留,那么那个传说中的Grok 5会是什么?一个能操纵市场的超级怪兽?
Alpha Arena的这场比赛给所有人都上了一课。
对于华尔街的基金经理们来说,那个曾经被轻视的AI,现在正盯着他们的饭碗。
它不需要睡觉,没有恐惧,而且它比任何人都更早知道你在X上骂了哪家公司。
当算法学会了贪婪,它收割世界的方式,甚至不需要流一滴血。
参考资料:
https://x.com/MarioNawfal/status/1997476276639264932
秒追ASI
⭐点赞、转发、在看一键三连⭐
点亮星标,锁定新智元极速推送!





京公网安备 11011402013531号