谷歌最新版本的Gemini2.5Deep Think在2025年国际大学生程序设计竞赛(ICPC)世界总决赛中创造历史,不仅获得金牌成绩,还解决了所有人类队伍都无法攻克的难题,标志着人工智能在复杂问题解决能力上的重大突破。
竞赛表现超越人类选手9月4日在阿塞拜疆巴库举行的ICPC世界总决赛汇聚了来自100多个国家近3000所大学的精英选手,最终139支队伍获得参赛资格。在这场要求参赛者在5小时内解决12道算法难题的顶级赛事中,Gemini Deep Think展现了惊人的实力。
该AI系统按照官方规则在线上参赛,比人类队伍晚10分钟开始。令人瞩目的是,它在45分钟内就解决了8道题目,并在3小时内完成另外2道,总计用时677分钟解决10道题目,这一成绩在人类选手中可排名第二。
最引人注目的是,Gemini Deep Think成功解决了问题C——这道关于通过可配置管道和储液器网络最大化液体分配系统效率的复杂题目,没有一支人类队伍能够攻克。该任务要求系统在几乎无限的可能性中找到最快的填充策略,展现了AI在抽象推理方面的突破性进展。
技术突破的背后据谷歌DeepMind介绍,这一成功源于预训练、后训练、高级强化学习方法、多步逻辑推理和并行问题求解等多个方面的综合进步。在强化学习过程中,模型接受了极其困难的编程任务训练,多个Gemini代理生成不同候选解决方案,在虚拟终端中测试并不断迭代改进。
这一版本直接基于几周前在国际数学奥林匹克竞赛(IMO)上夺得金牌的Gemini2.5Deep Think构建,显示了谷歌在AI推理能力上的快速迭代和提升。
产业意义与未来展望ICPC执行董事Bill Poucher博士将此称为转折点:"Gemini成功加入这一领域并取得黄金级成果,标志着定义下一代所需的人工智能工具和学术标准的关键时刻。"他强调,分解复杂问题、设计多步骤策略并正确实施的能力不仅在编程中重要,在药物发现、芯片设计和更广泛的研究领域同样至关重要。
谷歌DeepMind表示,Gemini可作为开发者的合作伙伴,理论上,人类和AI结合最佳解决方案能够解决所有12个竞赛问题。目前,Gemini2.5Deep Think的轻量版已通过Gemini应用向Google AI Ultra计划用户开放,未来版本预计将发展成为更强大的编程助手,应用于软件开发、物流和科学研究等领域。
AI奥林匹克竞赛白热化这一突破紧随OpenAI的重大成功。2025年8月,OpenAI系统在国际信息学奥林匹克竞赛(IOI)上夺得金牌,在330名人类参赛者中仅有5人表现超过它。与Gemini类似,这一结果同样来自通用推理模型而非高度定制的系统,显示了AI推理能力的快速发展。
谷歌在大学级ICPC竞赛上的金牌成绩进一步升级了AI竞赛的激烈程度,预计OpenAI也可能派出系统参与这一顶级赛事的竞争。