代码碾压一切！OpenAI神秘模型o3-alpha一夜刷屏，却遭41岁大神绝地反杀

IP属地中国·北京 编辑：孙雅新智元 时间：2025-07-19 16:05:38

编辑：定慧好困
OpenAI的神秘模型o3-alpha意外曝光，其强大的代码能力碾压众多AI。该模型疑似在东京AtCoder世界编程大赛2025中夺得亚军，最终不敌人类选手Psyho。
OpenAI果然藏了一手。
昨天夜里，一个名为「o3-alpha-responses-2025-07-17」的神秘模型被爆出。
网友们疯狂测试后，得出一致结论，这个模型强得离谱。
WebDev Arena网页的源码
甚至有网友在实测后，大赞o3-alpha，将它称为目前「最佳编码和物理模型」。
每次新模型出来后，小球的碰撞实验已经成为一种「传统」，这次「o3 Alpha」不仅完美的展示了物理碰撞，并且还能随时改变小球的大小。
在WebDev Arena上，「o3-alpha-responses-2025-07-17」以「Anonymous-Chatbot」的名称出现。
根据网友的猜测，它很有可能是在编码能力上得到了「史诗级」加强的o3升级版。
毕竟目前在WebDev Arena Leaderboard中，OpenAI只有一款专门编程的GPT-4.1-2025-04-14上榜。
不过，目前想要捕捉到这个匿名模型，需要在竞技场中多次尝试（我们在WebDev Arena多次尝试未能捕捉到这个匿名模型）。
Peter Gostev在竞技场中使用如下提示词「幸运的」捕捉到了o3-alpha，感兴趣的话你也可以试试。
还有网友爆出，OpenAI可能「派出」了这个模型去参加世界最难编程竞赛：东京举行的AtCoder世界巡回赛2025决赛。（需要OpenAI确定）
OpenAI的这个o3-alpha模型最终获得了第二，第一名是人类Psyho。
虽然o3-alpha可能已经被OpenAI下架，但网友们还是保留了丰富的实测案例。
从实测来看，「o3-alpha」在前端代码能力达到了领先水平——远胜于Claude Sonnet、o3、Gemini 2.5 Pro。
实测效果惊人
网友Peter Gostev发现该模型后，使用提示词「要求模型使用Three.js创建一个程序生成的星球」。
测试后，他很难相信，但是依然认为o3-alpha的编码水平达到一个全新的高度。
以下是完整的测试对比视频，可以看出o3-alpha的效果整体最好。
自动播放
OpenAI模型在前端能力方面一直表现平平，Peter表示这次的模型似乎终于在这方面超越了其他所有模型。
有网友用经典的「骑自行车的鹈鹕」进行了测试，表示o3 alpha完全打败了o3 pro。
以下是o3 alpha生成的动画版的效果，你觉得这个效果如何。
o3-alpha还能一句话就生成的「我的世界」模拟器。
超mini版GTA的复刻，o3-alpha也能一句话搞定。
自动播放
还能一键生成高度可定制的SVG应用。
有网友用o3-alpha造了一个魔方模拟器，甚至可以输入「魔方算法」来直接操控，确实太强大了。
自动播放
仅仅靠着文字提示就可以实现。
网友还用o3-alpha创建了一个太空入侵模拟游戏，再次体现了OpenAI这个新模型的前端代码能力。
自动播放
网友Mahi用只有2-3个单词的提示对比了o3-alpha和Gemini 2.5 Pro。
o3-alpha生成的网页效果要好于Gemini 2.5 Pro。
除了以上神秘的o3-alpha模型和OpenAI派出AI选手参与顶尖编程大赛外。
刚刚发布的ChatGPT Agent也实力惊人。
OpenAI的研究院Zhiqing Sun，表示ChatGPT Agent通过了ARC-AGI-3的第一关。
41岁大神击败AI
守住人类最后防线
o3-alpha被爆出的时机非常的「巧合」。
因为前两天在东京举行的AtCoder世界巡回赛2025决赛中，同样是OpenAI的一款匿名模型，获得了第二名。
根据网友爆料，这个模型很大概率就是o3-alpha。
我们推测OpenAI本来应该是打算「一鸣惊人」，但有一个名叫Psyho的人类戏剧性的打败了AI获得了第一名。
是的，这位来自波兰的编程大神——Przemysław Dębiak（aka Psyho），用一场惊心动魄的胜利告诉世界：人类，还没输！
地点是东京，AtCoder世界编程大赛的决赛现场。
空气中弥漫着紧张的气息，因为这次的对手非同寻常——一个由OpenAI亲自下场派出的AI模型。
在这里，人类和AI选手需要在10小时内，不断优化墙壁的设置以及机器人的分组，让它们能够在30x30的网格内以最少的步数回家。
从华沙一路飞到东京的「Psyho」，本来就已经身心俱疲。
而这场堪称马拉松的比赛，更是让他愈发感觉自己已经濒临极限。
「我累到爆炸，真的，有好几次我都想直接放弃算了，」他回忆道。
三天里，「Psyho」只睡了10个小时。
而他的对手，那个「不知疲倦」的AI，早已能够在诸如算法实现、代码优化等纯粹的工程任务中，凭借着更快地速度碾压人类。
不过，这次的比赛，是人类的主场。
原因在于，比赛时间越长，就越考验从零到一的创造性，AI就会越吃力。
比赛一开始，AI很快就以绝对优势实现领先；
直到第7小时，一步步稳扎稳打的大神「Psyho」才实现反超，而AI却陷入了困境；
第8小时，AI突然发现了一个全新的思路，并一举超越了「Psyho」——新方法不仅实现了更好的墙体设计，还带来了更好的资源调度；
即将进入倒计时阶段，剧情再次反转。「Psyho」灵感乍现，对AI完成了绝地反杀！虽然AI还在不断调整，但差距却越来越大。
最终，这个41岁的男人，成功在长达10小时鏖战的最后关头，凭借着血肉之躯和人类独有的创造力，战胜了冰冷的机器！
对于这场胜利，奥特曼亲自发文祝贺道：「干得好，Psyho。」
与此同时，OpenAI官方也发文表示：「我们的模型拿了第二。恭喜冠军，这次你成功地阻击了我们！」
更有趣的是，比赛的组织者都惊呆了。
他们坦言：「我们本来就觉得人类会赢，但说实话，我们被AI能拿到第二名给吓到了！」
他们一针见血地指出：「在代码优化的硬实力上，AI已经超越了人类，但它唯独缺少了人类那神来之笔的创造力。」
没错！「Psyho」赢得不靠蛮力，而是靠一个「完全不同的解题思路」。
当所有人都和AI在同一条赛道上狂奔时，他另辟蹊径，找到了AI视野之外的「最优解」。
而他用的武器也很简单，就是最常规的编程软件，连AI辅助工具都没用。
当然，这只是一场战役的胜利，远非「人机」大战的结束。
从IBM「深蓝」到谷歌「AlphaGo」，AI战胜人类的传奇早已上演。奥特曼也预言，AI很快就会在编程竞赛中全面超越人类。
但至少在东京的那个不眠之夜，一位名叫「Psyho」的孤胆英雄，为人类赢得了一丝喘息。
参考资料：
https://x.com/chetaslua/status/1946154816691966227
https://x.com/chetaslua/status/1946165458048291091

标签：模型人类编程世界网友东京代码能力大神大赛碾压小时决赛 代码优化 思路 倒计时 效果发文战胜算法编码 奥特曼 创造力 调度长达原因工程程序高度 模拟游戏 远非

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

腾讯《金铲铲之战》鸿蒙版9月上线，预计为正式服版本

网易多款游戏宕机，内部人士：“系机房网络故障”

消息称任天堂供应链正在测试3D NAND闪存Switch 2游戏机卡带

马斯克放话：3 - 6 个月后，特斯拉车主将能边开车边打游戏

看完谷歌Meta最新财报，终于理解它们为啥砸锅卖铁干AI了

开源首个3D世界模型！腾讯要用AI重塑娱乐产业，游戏只是前菜

全站最新

马化腾深夜发朋友圈，大佬集体疯狂？

AI Lab撤销、部分人员并入混元，腾讯AI组织架构为何再变阵？

DeepSeek核心人才入职百度，但不是郭达雅

小米笔记本Pro 14开售，万元工艺轻薄本

热门推荐

腾讯《金铲铲之战》鸿蒙版9月上线，预计为正式服版本

第五人格崩了上热搜网易旗下多款游戏回应：紧急排查中

网易多款游戏宕机，内部人士：“系机房网络故障”

马斯克放话：3-6个月后，特斯拉车主将能边开车边打游戏

消息称任天堂供应链正在测试3D NAND闪存Switch 2游戏机卡带

马斯克放话：3 - 6 个月后，特斯拉车主将能边开车边打游戏

看完谷歌Meta最新财报，终于理解它们为啥砸锅卖铁干AI了

腾讯游戏再陷抄袭风波：索尼起诉《荒野起源》涉嫌侵权

开源首个3D世界模型！腾讯要用AI重塑娱乐产业，游戏只是前菜

被大规模投诉！叠纸网络爆款游戏“翻车”

LeapMove 儿童体感游戏机发布，69.99 美元

直击CJ2025：骁龙如何从游戏芯到全能王？

骁龙和ChinaJoy的第七年：站上C位，不负用户所望 | 凤凰V现场

ChinaJoy“AI味”正浓，游戏交互方式与玩法体验被革新

搜狐Q2总收入1.26亿美元净亏损同比收窄超40%