7月22日,在第66届国际数学奥林匹克竞赛(IMO)中,谷歌DeepMind的Gemini Deep Think模型正式参赛并获得金牌,成绩为35分,达到金牌标准。
该模型采用通用推理方法,直接处理自然语言问题,并在官方规定的4.5小时时限内完成解答。
相比之下,OpenAI未正式参赛,而是通过三位前IMO金牌得主独立评分,宣称其实验性推理模型同样解答了五道题目,达到金牌水平,但因未经过IMO委员会的正式验证,引发争议。
谷歌DeepMind自去年起与IMO官方密切合作,其结果由竞赛委员会正式认证,而OpenAI的提前宣布违反了IMO竞赛委员会的信息披露规则。
IMO是全球最负盛名的数学赛事之一,今年共有630名参赛者,仅有67人获得金牌。谷歌计划将Gemini Deep Think提供给数学家测试,并最终向其AI Ultra订阅用户开放,定价为每月250美元。OpenAI则表示短期内不会发布这一级别的数学能力模型。