“深层思维”宣布人工智能测试得分达国际数学奥赛金牌水平

IP属地中国·北京 编辑：柳晴雪新华社 时间：2025-07-22 16:27:31

　　新华社伦敦7月22日电　谷歌旗下“深层思维”公司21日宣布，其搭载了“深度思考”能力的高级版“双子座（Gemini）”人工智能模型测试得分达到国际数学奥林匹克竞赛（IMO）金牌水平，该成绩已获官方认证。
　　“深层思维”公司在官网发布公报说，高级版“双子座”模型的“深度思考”模式成功解答了2025年国际数学奥林匹克竞赛6道题目中的5道，共获35分，达到金牌水平。相关解题方案已在网上公布。
　　“我们可以证实，谷歌‘深层思维’已达成这一备受期待的里程碑，在总分42分中获得35分——这已达到（今年）金牌分数线。”国际数学奥林匹克竞赛主席格雷戈尔·多利纳尔教授说。他称解题方案在诸多方面都“令人惊叹”。国际数学奥林匹克竞赛评分员认为这些方案清晰、精确，且大多数都易于理解。
　　国际数学奥林匹克竞赛自1959年起每年举办一届，参赛选手需在两天（每天各4.5小时）内解答涉及代数、组合数学、几何和数论四大领域的6道极具难度的题目。近年来，该竞赛成为检验人工智能模型解决高级数学问题能力和推理能力的热门挑战。
　　“深层思维”公司推出的人工智能模型AlphaProof与AlphaGeometry 2组合解答了2024年国际数学奥林匹克竞赛6道题中的4道，以28分的成绩达到当年银牌水平。为了让这两个模型理解题目，专家先将题目从自然语言翻译成特定计算机语言，解题总共耗费两到三天的计算时间。今年，高级版“双子座”测试成果相比去年有显著进展，它直接根据自然语言描述的题目给出数学证明，并在竞赛时限内完成挑战。竞赛协调员采用与学生选手解题方案相同的标准对其进行正式评分和认证。
　　“深层思维”公司说，今年取得的成果得益于高级版“双子座”的“深层思考”模式——这是一种针对复杂问题的增强推理模式，融合了“并行思维”等最新技术。这种模式设置可使模型在给出最终答案之前，同时探索并整合多种可能的解决方案，而非沿着单一、线性思路推进。（完）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

大模型进展专栏第七期｜人工智能赋能科研范式重塑中国科学院 “磐石·科学基础大模型”

博通发布Jericho4芯片：台积电3nm工艺，可连接超100万颗处理器

中山医院获批国家人工智能应用中试基地建设项目，将打造医疗AI创新策源地

“人工智能场景化应用创新与产业落地论坛”在哈尔滨举行多领域创新成果集中亮相

以科技引领产业，绘人工智能发展新篇

向新而行｜人工智能的“头雁”效应

全站最新

美载人绕月飞船溅落在预定海域

美股三大指数10日涨跌不一纳指八连涨

程前删除“AI写作年赚200万”视频

美载人绕月飞船返回地球溅落在预定海域

热门推荐

中东人工智能金融科技公司Alaan获4800万美元融资，助力企业智能化管理！

大模型进展专栏第七期｜人工智能赋能科研范式重塑中国科学院 “磐石·科学基础大模型”

博通发布Jericho4芯片：台积电3nm工艺，可连接超100万颗处理器

美国证券交易委员会成立人工智能专责小组助力创新与效率提升

伊利诺伊州立法禁止人工智能提供心理健康服务

中山医院获批国家人工智能应用中试基地建设项目，将打造医疗AI创新策源地

“人工智能场景化应用创新与产业落地论坛”在哈尔滨举行多领域创新成果集中亮相

国家安全部：警惕人工智能“数据投毒”

“人工智能+”覆盖12个领域张家口人工智能应用场景加速落地

推动区域人工智能技术应用中科闻歌人工智能研发中心启用

以科技引领产业，绘人工智能发展新篇

向新而行｜人工智能的“头雁”效应

警惕人工智能数据污染：0.01%虚假文本可使有害输出增11.2%

库克：从未对苹果的产品规划感到如此兴奋

独家对话中国联通赵亚晖，AI时代的“数据燃料”是如何炼成的？ | 浪潮对话