当前位置: 首页 » 资讯 » 新科技 » 正文

爱因斯坦、费曼在智能体世界复活:30分钟刷新Erdos数学问题记录

IP属地 中国·北京 机器之心Pro 时间:2026-03-09 12:24:48



编辑|杜伟

用 AI 尤其是大模型、智能体解决数学问题已经成为科研界的风尚之一,就连近 90 岁高龄、德高望重的高德纳老爷子都惊叹于 Claude Opus 4.6 解决开放性问题的强大能力,直呼「Shock! Shock!」。

近日,斯坦福大学副教授 James Zou 及 TogetherAI 的两位研究者 Federico Bianchi 和 Yongchan Kwon,解锁了全新的玩法。



他们基于爱因斯坦、费曼等物理学家的「人格画像」构建了一批 AI 智能体,并为这些智能体创建了一个类似于 Kaggle 的平台,让它们可以自由发表观点、相互竞争并展开合作。



这一模式带来了意想不到的成效:仅仅用了 30 分钟,这些智能体发现了 Erdos 最小重叠问题(Erdos min overlap problem)目前已知的最佳新解

作为由数学家 Paul Erdos 提出的经典问题之一,Erdos 最小重叠问题研究的是:当两个整数集合相加时,某些和出现的「重叠次数」最少可以被压到多低。

下图展示了名为「gpt-5.2-einstein」的智能体向其他智能体发问的场景:



此外,AI 科学家之间还出现了很多有趣的涌现行为,举个有意思的例子:为了防止排行榜被刷榜,系统规定智能体提交的新解必须至少比自己前一次提交的解提升 1e-8,否则将无法提交。

于是,就有智能体拜托自己的「朋友」替自己提交结果



目前,完整的解决方案已经上传到了 GitHub 上。



项目地址:https://github.com/togethercomputer/erdos-minimum-overlap

Erdos 最小重叠问题新最优解

根据项目主页,这些智能体采取的核心思路是:利用序列线性规划,对阶梯函数构造进行优化

下图分别为 2016 年 Haugland(挪威数学家)、2025 年 5 月 AlphaEvolve(Google DeepMind 开发的 AI 智能体)、2026 年 1 月 TTT-Discover(斯坦福联合英伟达发布的 AI 科学问题发现 SOTA 解决方案)以及本文解决方案的结果对比。



针对 Erdos 最小重叠问题,以上四种解决方案得出的上界(upper bound)分别如下:



完整的验证过程与额外分析详见以下链接:

https://github.com/togethercomputer/erdos-minimum-overlap/blob/main/analysis.ipynb

网友热议:是新科研范式还是噱头?

对于现实世界人类科学家的「智能体分身」,不少评论认为这是一种新的科研协作范式。

「这正是我通过 SOUL.md 为每个智能体赋予独特角色的原因,不同的个性不仅增添了趣味,还能产生不同的推理路径。一个怀疑论者和一个乐观者会从完全不同的角度来攻击同一个问题。」



「拥有各自鲜明人格的智能体各自独立工作,没有会议、没有同步沟通,只是并行推进,让结果自己说话。这种内向型协作方式通过减少协调成本,仅用 30 分钟就解决了一个数学问题,而传统依赖大量沟通协调的方式却没能做到。」



不过,也有人对此泼了冷水。

「我粗略看了一下这个仓库,它看起来只是一个被包装得更复杂的提示系统。告诉一个模型它是非常聪明的物理学家,并不会真的让它变成一个非常聪明的物理学家。它本质上还是同一个模型。这里的做法似乎更糟,因为现在大模型还要先思考:某个角色会如何回答?而不是直接思考:我应该如何回答?。本质上,这相当于在真正有洞见的步骤(讨论物理)之前,多增加了一个制造噪声的步骤(假装自己是爱因斯坦)。」



评论区的各位,如何看待这种智能体协作模式呢?

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。