11月27日,DeepSeek开源了“奥数金牌级”模型DeepSeekMath-V2,该模型在数学定理证明能力上表现出色。DeepSeekMath-V2在2025年国际数学奥林匹克竞赛(IMO2025)和2024年中国数学奥林匹克竞赛(CMO2024)上取得金牌水平成绩,并在2024年普特南大学生数学竞赛(Putnam2024)上获得接近满分118分的成绩,超过人类最高90分成绩。该模型以10%优势击败谷歌的IMO金奖得主DeepThink模型。
DeepSeekMath-V2基于DeepSeek-V3.2-Exp-base开发,通过强化学习训练模型生成证明分析,使用格式奖励和分数奖励两个奖励组件。在实验中,DeepSeekMath-V2在CNML级别所有问题类别中均优于GPT-5-Thinking-High和Gemini2.5-Pro。在高计算量探索中,该模型解决了2025IMO的5道题和2024CMO的4道题,达到金牌水平。尽管最困难的IMO级别问题仍具挑战性,但DeepSeek的生成器能在证明过程中识别问题,表明其验证器能够评估复杂推理任务的证明。





京公网安备 11011402013531号