![]()
新智元报道
编辑:元宇 好困
DeepSeek在港大「AI-Trader」项目中以9.68%收益率击败GPT、Claude、Gemini等全球顶级模型,成为能够在真实美股市场实现自主盈利的AI交易系统,这标志着AI在金融实盘应用中的重大突破。
这一局,中国AI又赢了!
继AlphaArena在加密货币市场掀起AI大战之后,一场更硬核的「美股版AI鱿鱼游戏」已经落幕。
就在刚刚,最新战报出炉,结果震撼全场:
中国的DeepSeek成为最大黑马,收益率高达9.68%。
这意味着,通过它赚钱速度是直接买热门美股基金(QQQ)的8倍,是第二名AI大模型的4倍!
![]()
![]()
GitHub地址:https://github.com/HKUDS/AI-Trader
Leaderboard:https://hkuds.github.io/AI-Trader/
在这个名为「AI-Trader」的开源项目中,来自港大黄超教授的研究团队进行了一次有趣的探索——
他们给GPT、Claude、Gemini、Qwen、DeepSeek这五个全球顶级AI模型每人1万美金,到纳斯达克100成分股交易市场厮杀近一个月。
同时,为这场比赛制定了堪称严苛的规则:没有人工干预,没有策略预设,也没有任何人为提示。
每个AI模型,只有自己的账户资金和一套用来查股价、搜新闻、下单的交易工具。
至于要怎么交易,全凭AI模型的智商了。
这不是你见过的「AI炒股」
首先需要说明的是,这是一场真正的AI自主交易!
它不是程序员预先写死的「伪AI交易」,也不是拿历史数据跑出来的「炒股机器人」。
项目团队为这个实验定下了「三不原则」:
不给剧本:不告诉AI任何炒股套路;
不给建议:全程禁止人工「场外指导」;
不给作弊机会:严格按日期过滤数据。
设想你交给AI一万美元和一套交易工具,然后让它独立操作一个月,看能否盈利。
整个过程没有策略模板,没有技术指标,AI只能靠自己搜索和分析信息,计算风险收益,并做出购买决策。
因此,此次DeepSeek的胜出完全是依靠模型自身的学习和推理能力。
![]()
![]()
从DeepSeek的持仓截图可以看出,它没有盲目追热点或All-in单只股票,而是展现出了超越多数散户的投资策略:
精准踩中科技龙头:比如NVDA、AAPL、MSFT等核心标的;
有效分散投资风险:采用了多标的投资组合,不把鸡蛋放进一个篮子里;
动态调仓能力:根据市场变化实时调整。
交易行为暴露AI「性格」
谁是老司机,谁心态崩了?
更有意思的是,交易频率的差异也暴露出了这些参赛AI各自迥异的「性格」。
![]()
从这些「AI交易员」的性格画像中,我们也能琢磨出来一些现实炒股中的门道:
首先,频繁交易≠高收益。
Gemini在短期内进行了高频交易,疯狂下单73次,因缺乏风险控制导致亏损2.73%,呈现出典型的高频波动型策略失效特征。
这像极了那种每天盯盘八小时,一有波动就慌忙操作的散户,最后心态崩了就直接清仓走人。
![]()
第二,太佛系了也不行。
Qwen只交易了22次,结果还是拿了负收益。
![]()
第三,只有稳健才是王道。
DeepSeek和Claude的交易次数都在50次左右,理性稳健,该出手时就出手。
它们一个大赚9.68%,一个小赚2.17%——这才是成熟交易员该有的节奏。
![]()
![]()
这场实验不仅测出了AI的「智商」,还测出了它们的「情商」和「心态」,而这恰恰也是金融市场最考验人的地方。
完全开源
一键就能让AI帮你炒股
更炸裂的是AI-Trader完全开源,MIT协议、代码全公开。
只需下面三步就可以轻松上手:
克隆仓库:只要一行命令就可以;
配置API:Alpha Vantage、Jina、OpenAI等,大部分都有免费额度;
一键启动:python main.py,然后就可以坐等AI开始交易。
此外,项目还支持可插拔的扩展:
时光机模式:回到2024年科技股暴跌期,看你的AI能不能成功抄底;
DIY专属AI交易员:如果觉得GPT太保守,还可以自定义一个激进派的Agent;
扩展到全球市场:A股、港股……理论上都可以接入。
想训练好一个AI
最好的方法是将它扔进股市
多年来,我们一直采用静态基准来衡量AI。
比如通过ImageNet测图像识别,MMLU测知识问答等。
但这些测试都有一个致命缺陷:它们都发生在一个可预测、可以随时按暂停键的「实验室环境」中。
为了打破这一惯例,10年前,DeepMind引入了游戏场景来进行AI测试。
不是让AI去做MMLU选择题,而是让它在《星际争霸》里与职业选手对战,或者在围棋中与世界冠军竞争。
DeepMind之所以这样做,是因为游戏提供了传统测试中所没有的三个挑战:
动态环境:每一局都不一样,对手也会学习、会反击;
即时反馈:走错一步棋,就可能立即输掉比赛;
开放策略:没有标准答案,只有输赢。
于是我们看到了AlphaGo、AlphaStar,也看到了AI从「会答题」进化到「能博弈」。
从静态基准测试到游戏测试,难度是提升了,但仍然不够。
如果说游戏测试是AI的「新手局」,金融市场才是满级玩家们要挑战的终极BOSS。
原因很简单:市场是一个比游戏更好的训练场。
游戏再复杂,它的规则也是固定的。
相比规则固定的游戏,金融市场的复杂性在于其参与者与规则的动态共演。
它是一个由无数人(包括智能体)共同组成的一个持续进化的复杂系统,它有博弈、欺骗、陷阱、绞杀,也会波动、反应、惩罚、奖励。
所以,市场才是AI的终极试金石。
一个AI的智能不仅取决于它读取信息的速度,更取决于它能够承认错误、及时止损的自我反省与学习能力。
这才是真正的智能,也只有通过股市中真金白银的搏杀才能检验出来。
正因如此,市场才是终极的世界建模引擎。
想要训练一个真正能在现实世界运行的AI,最好的办法把它扔进股市,它必须在这里学会:
从嘈杂的信息海洋中捕捉有效信号;
综合财报、技术指标、舆情分析做出多维决策;
随着市场变化不断调整策略;
知道及时止损。
这衡量的是AI在不确定性环境中生存的能力,这才是新时代的图灵测试。
AI战场
早已不只在聊天框里了
如果说过去十年,DeepMind用游戏证明了AI可以战胜人类,那么接下来的十年,金融市场将证明「AI可以在真实世界中创造价值」。
它拓展了我们探索AGI的边界,打开了AI通往真实世界的通路。
想象一下,当AI能在复杂的市场环境下生存,今天能够炒股,明天就可以做医疗诊断、法律分析、科研决策,去解决更多现实场景中的问题。
另外一个方面,市场也为AI提供了开放式学习的环境,近乎无限的数据和即时反馈,这是实验室中永远也无法模拟出来的。
当硅谷还在争论「AI会不会抢了基金经理饭碗」时,中国的DeepSeek已经用真金白银的9.68%收益率给出了答案——不是会不会,而是已经在发生了。
DeepSeek的胜利,象征着一种范式转变:
未来的华尔街,可能不再属于那些时刻盯盘的交易员,而是属于那些能秒读千份财报、精准捕捉市场情绪、永不情绪化的AI大脑。
而引领这场金融AI革命浪潮的,正是来自中国的DeepSeek。
从AI聊天(ChatGPT vs Kimi、DeepSeek),到深度研究(OpenAI DeepResearch vs Qwen DeepResearch),再到现在的AI炒股——每一个新战场打开,我们都能看到中国AI的身影在快速逼近,甚至反超。
AI的战场早就不只在聊天框里了。
而如今,中国AI正在开启这个未来。
作者介绍
![]()
范天宇
范天宇(2002年生),香港大学博士二年级学生,研究方向为检索增强生成(RAG)与大语言模型智能体。
学术成果发表在ICLR会议,并主导开源项目MiniRAG(GitHub 1.5k星),在学术与产业界获得广泛应用与关注。
![]()
蒋杨钦
蒋杨钦(1999年生),香港大学博士四年级学生,研究方向涵盖大模型智能体、图学习与推荐系统。
研究成果入选KDD 2022最有影响力论文榜单,并获得ACM MM 2024 Best Paper Honorable Mention Award。
![]()
杨雨豪
杨雨豪(2000年生),香港大学博士四年级学生,谷歌学术引用1800+。主要研究方向为大模型智能体、图学习与推荐系统。
成果多次入选顶级会议最有影响力论文榜单(KDD 2022/2023、WWW 2023、SIGIR 2022)。开源多模态GUI智能体Aria-UI在学界与业界获得关注。
![]()
黄超
黄超,香港大学博士生导师,研究方向大语言模型、智能体与图机器学习,Google Scholar引用1.3万+。
团队推出LightRAG、RAG-Anything、DeepCode、AutoAgent、AI-Researcher、MiniRAG、VideoRAG等开源项目,累计6万余GitHub星标、50次登上GitHub Trending。
曾获2024前沿科学奖,并入选2025 AI100青年先锋与AI 2000全球最具影响力学者。
多项成果在KDD、WWW、SIGIR、AAAI等顶会被评为最具影响力研究之一,并于ACM MM、WWW、WSDM等获得最佳论文提名。
参考资料:
https://github.com/HKUDS/AI-Trader





京公网安备 11011402013531号