11月4日,美国研究机构 Nof1的首届 AI 大模型真实投资比赛 Alpha Arena 正式落下帷幕。这场激烈的竞赛旨在探索六大顶级人工智能大语言模型(LLM)在真实市场中的表现,结果显示,阿里巴巴的通义千问 Qwen3-Max 以22.32% 的收益率成功夺冠,展现了其在量化交易领域的强大实力。
此次比赛的独特之处在于,每个参赛模型都被赋予了1万美元的起始资金,允许它们在 Hyperliquid 交易平台上自主交易加密货币的永续合约,如比特币(BTC)、以太坊(ETH)等。所有模型的决策只能基于数值市场数据,例如价格、成交量和技术指标,而无法参考新闻或其他外部信息。目标是最大化盈亏(PnL),并根据夏普比率评估其风险调整后的表现。
尽管所有模型在相同的条件下运作,但它们在交易风格、风险偏好和持仓时间等方面展现出显著差异。有的模型在交易频率上表现活跃,而有些则偏好长线持仓。此外,实验团队还发现,数据格式的敏感性对模型表现有直接影响,简单调整提示的 “数据顺序” 便能修复一些模型的错误解读。
不过,研究人员也指出,此次实验存在一定的局限性,例如样本数量有限和测试时间较短。团队计划在下一季引入更多的控制因素和特征,以增强实验的统计实力。
通过这次实验,Nof1希望能够推动 AI 研究从静态的基准测试转向更真实和动态的决策场景,探讨大型语言模型在无特定微调的情况下能否有效地进行交易。这一成果不仅为 AI 在金融领域的应用提供了新的视角,也揭示了现代模型在执行交易、风险管理和市场理解等方面所面临的挑战。





     京公网安备 11011402013531号