当前位置：首页 » 资讯 » 新科技 » 正文

OpenAI拿IMO金牌是火了，但惹怒大批人：抢发炒作，抢学生风头

IP属地中国·北京 编辑：沈如风机器之心Pro 时间：2025-07-21 14:20:21

机器之心报道
机器之心编辑部
就在上个周末，Sam Altman 大张旗鼓地宣布，OpenAI 的一款未公开实验性大语言模型在 2025 年国际数学奥林匹克竞赛（IMO）中达到了金牌水平，得分 35/42，成功跻身全球顶尖数学竞赛选手行列。

有意思的是，据报道不止 OpenAI，谷歌 DeepMind 在这次比赛中，也拿到了 IMO 金牌。但相比 OpenAI 的高调官宣，这次谷歌显得有点低调。
谷歌的低调是有原因的，根据 IMO 组委会一位成员、两届 IMO 金牌得主 Joseph Myers 的说法，IMO 曾要求 AI 公司（即参赛的大模型）不要抢走参赛学生的风头，建议在闭幕式后一周再公布相关结果，一方面是出于对人类参赛者的尊重，另一方面也是为了留出时间对人工智能提交的答案和格式进行验证。

然而，OpenAI 却在闭幕式之前（但根据 OpenAI 研究科学家 Noam Brown 的说法是之后）就公布了结果。
IMO 评审团和协调员的普遍看法是，OpenAI 的这种做法很无礼，也不合适。
遗憾的是，OpenAI 似乎更在乎炒作和声量，不惜抢占参赛学生的风头，于是他们在昨天就提前公布了结果。

来自 OpenAI 的员工在庆祝自家模型获得了 IMO 金牌，时间和 IMO 闭幕式时间非常相近，闭幕时间在 7 月 19 日（当地时间）下午 4 点举行。
也不知是否是因为 OpenAI 抢发，机器之心也了解到，谷歌 DeepMind 与字节 Seed 团队 IMO 竞赛的结果，也将在今天或者近期公布，且分数是官方评的。
另外，Joseph Myers 还表示，OpenAI 没有与 IMO 合作测试他们的模型，91 名官方 IMO 协调员都没有对 OpenAI 的解决方案进行评级。
相比来看，DeepMind 似乎很遵守规则，并耐心等待官宣时间。

一家专注于数学 AI 的初创公司 Harmonic 公开证实了这一点：「为了维护学生竞赛的神圣性，IMO 董事会要求参赛的 AI 公司需要等到 7 月 28 日发布结果。」
看来，OpenAI 确实是没有遵守 IMO 要求，提前就把结果公布了。

谷歌 DeepMind 推理团队负责人 Thang Luong 对此事也进行了点评，表示道，IMO 组委会确实有一份官方评分标准，但这份评分指南并未对外公开。如果没有依据该评分标准进行评估，参赛组织就无法宣称获得奖牌。如果有一分被扣，那就是银牌，而不是金牌。

IMO 金牌得主 Jasper 观点与 Thang Luong 的观点相似：IMO 的竞赛题目通常包括 6 道，每个问题 7 分。金牌的分数线是 35 分，银牌 28 分，铜牌 19 分。即使是扣除很少的分数，OpenAI 也可能跌落到银牌。Jasper 认为从 OpenAI 提交的内容来看，他们的答案很可能会被扣掉一些分数。
陶哲轩（Terence Tao）也指出，尽管题目保持不变，但测试形式至关重要。一名在标准条件下可能无法获得铜牌的学生，若在修改后的赛制下甚至可能摘金。所以说，OpenAI 是否获得金牌，现在还是一个问号。

如果真像前文所说的，OpenAI 最终获得银牌，这种反转还是挺残酷的，毕竟他们大肆宣传自己的模型是金牌得主水平了。

OpenAI ：没有人通知我们一周后才能公布
对于此事，OpenAI 也做出了回应，OpenAI 研究科学家 Noam Brown 表示，他们是在闭幕式之后发布的结果，他个人提前联系了一位 IMO 组织者，并根据其建议时间发布结果。同时，Noam Brown 表示，没有人告诉他们「一周之后」才能发布。

另外，Noam Brown 还表示 IMO 官方几个月前曾联系他们，提出在比赛结束后提供 Lean 格式（允许用户将数学定理和证明以机器可验证的形式表达）的题目，但 OpenAI 拒绝了。

这算不算回应了前面的质疑：官方要求参赛 AI 公司闭幕式后一周再公布相关结果，但我们根本没参赛。
这一回应引发了网友的激烈讨论，对此你怎么看呢？

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

华为练秋湖研发中心今日起禁入电动自行车：内设共享电单车

从集中到分布式，联通云如何以“算网融合”破局大模型时代的算力挑战？

Anthropic联合创始人：团队成员极具使命感，Meta天价薪酬也挖不动

新iPad Pro将配备前置双摄像头：横屏竖屏都能用

格局生变：三星Galaxy Z Fold7折叠屏手机韩国预订量超Z Flip7，占比达60%

奥尔特曼：DeepSeek团队很有才华，但他们没找到比OpenAI更高效的方法

全站最新

华为练秋湖研发中心今日起禁入电动自行车：内设共享电单车

从集中到分布式，联通云如何以“算网融合”破局大模型时代的算力挑战？

Anthropic联合创始人：团队成员极具使命感，Meta天价薪酬也挖不动

新iPad Pro将配备前置双摄像头：横屏竖屏都能用

热门推荐

华为练秋湖研发中心今日起禁入电动自行车：内设共享电单车

从集中到分布式，联通云如何以“算网融合”破局大模型时代的算力挑战？

Anthropic联合创始人：团队成员极具使命感，Meta天价薪酬也挖不动

新iPad Pro将配备前置双摄像头：横屏竖屏都能用

格局生变：三星Galaxy Z Fold7折叠屏手机韩国预订量超Z Flip7，占比达60%

奥尔特曼：DeepSeek团队很有才华，但他们没找到比OpenAI更高效的方法

京东外卖新模式上线：首家自营外卖门店开业

雅虎日本力推“工作AI化”，强制1.1万名员工全面使用生成式AI

注定小众的Something：Nothing Phone(3)为谁而生？

特斯拉Robotaxi无人驾驶出租车体验升级：可精确停靠在用户手机所在位置

理想汽车OTA 7.5即将开启推送：新增全球首个超级对齐辅助驾驶功能

李想晒三车同框！坚称大空间纯电SUV就该像理想i8

京东外卖新模式：首家自营外卖门店开业！

外卖大战：残暴的开始必将以残暴结束

3373亿元巨额收购告吹，7-11便利店不卖了