在阿塞拜疆巴库举行的 2025年国际大学生程序设计竞赛(ICPC)全球总决赛中上,来自 100 多个国家的 139 支大学队伍在五小时内角逐解决 12 个算法问题,最终圣彼得堡国立大学凭借解决 11 个算法问题夺得人类冠军。在相同约束条件下的并行 AI 赛道上,谷歌的 Gemini 2.5 Deep Think 模型解决了 10 个问题,获得了与金牌相当的成绩。
最震撼的是OpenAI 的内部推理模型获得了 12 /12的满分,超越了所有人类队伍,拿下第一
值得注意的是OpenAI和谷歌的模型都解决了所有人类参赛队伍都没有解决的问题c。OpenAI的内部推理模型在经过9次尝试后解决了最难的问题,其余问题都是一次解决
OpenAI:获满分成绩,超越人类冠军
OpenAI的推理系统在本次竞赛中取得了12题全解的完美成绩,该成绩超过了所有人类参赛队伍
成绩与排名:解决了全部12个问题。如果参与人类排名,该成绩将位列第一。本届最优秀的人类队伍解决了11个问题
比赛条件:AI参加了官方的现场AI赛道,与人类选手共享5小时的比赛时限,并接收完全相同的PDF格式题目。系统自主选择并提交答案,无人工干预
解题详情:在12个问题中,11个为一次性提交正确。最难的一个问题在第9次提交后成功解决
技术构成:参赛系统由多个通用模型组成,包括GPT-5和一个实验性推理模型。其中,GPT-5解决了11题,实验性推理模型解决了最难的第12题,并负责最终提交决策。所有模型均未针对ICPC进行专门训练
Google DeepMind:获金牌级表现
谷歌DeepMind的Gemini 2.5 Deep Think系统在竞赛中解决了10个问题,达到了金牌级别
成绩与排名:解决了12个问题中的10个。该成绩达到了金牌分数线(前四名队伍获金牌),如果参与排名,将位列第二
比赛条件:AI在一个远程在线环境中比赛,遵循ICPC规则,比人类选手晚10分钟开始
关键亮点:独立解决了“Problem C”,这个问题在本次比赛中没有任何一支人类大学队伍能够解决。Gemini在比赛开始后半小时内完成了该题
解题效率:在比赛开始45分钟内解决了8个问题,三小时内完成了全部10个问题
人类队伍排名:
1.第一名:圣彼得堡国立大学 (St. Petersburg State University)
* 解题数:11
* 总罚时:1478
2.第二名:东京大学 (The University of Tokyo)
* 解题数:10
* 总罚时:1116
3.第三名:北京交通大学 (Beijing Jiaotong University)
* 解题数:10
* 总罚时:1425
4.第四名:清华大学 (Tsinghua University)
* 解题数:9
* 总罚时:865
5.第五名:北京大学 (Peking University)
* 解题数:9
* 总罚时:887
6.第六名:哈佛大学 (Harvard University)
* 解题数:9
* 总罚时:995
7.第七名:萨格勒布大学 (University of Zagreb)
* 解题数:9
* 总罚时:1075
8.第八名:麻省理工学院 (Massachusetts Institute of Technology)
* 解题数:9
* 总罚时:1123
9.第九名:中国科学技术大学 (University of Science and Technology of China)
* 解题数:9
* 总罚时:1128
10.第十名:首尔大学 (Seoul National University)
* 解题数:9
* 总罚时:1133
至此,OpenAI在 IOI 中获得第 6 名,在 AtCoder 竞赛中获得第 2 名ICPC2025上取得了满分,2026年人类的编程能力可能会永远落后于AI,不单单是个人coding能力还包括软件工程能力