当前位置：首页 » 资讯 » 新科技 » 正文

爱因斯坦、费曼在智能体世界复活：30分钟刷新Erdos数学问题记录

IP属地中国·北京 机器之心Pro 时间：2026-03-09 12:24:48

编辑｜杜伟
用 AI 尤其是大模型、智能体解决数学问题已经成为科研界的风尚之一，就连近 90 岁高龄、德高望重的高德纳老爷子都惊叹于 Claude Opus 4.6 解决开放性问题的强大能力，直呼「Shock! Shock!」。
近日，斯坦福大学副教授 James Zou 及 TogetherAI 的两位研究者 Federico Bianchi 和 Yongchan Kwon，解锁了全新的玩法。

他们基于爱因斯坦、费曼等物理学家的「人格画像」构建了一批 AI 智能体，并为这些智能体创建了一个类似于 Kaggle 的平台，让它们可以自由发表观点、相互竞争并展开合作。

这一模式带来了意想不到的成效：仅仅用了 30 分钟，这些智能体发现了 Erdos 最小重叠问题（Erdos min overlap problem）目前已知的最佳新解
作为由数学家 Paul Erdos 提出的经典问题之一，Erdos 最小重叠问题研究的是：当两个整数集合相加时，某些和出现的「重叠次数」最少可以被压到多低。
下图展示了名为「gpt-5.2-einstein」的智能体向其他智能体发问的场景：

此外，AI 科学家之间还出现了很多有趣的涌现行为，举个有意思的例子：为了防止排行榜被刷榜，系统规定智能体提交的新解必须至少比自己前一次提交的解提升 1e-8，否则将无法提交。
于是，就有智能体拜托自己的「朋友」替自己提交结果

目前，完整的解决方案已经上传到了 GitHub 上。

项目地址：https://github.com/togethercomputer/erdos-minimum-overlap
Erdos 最小重叠问题新最优解
根据项目主页，这些智能体采取的核心思路是：利用序列线性规划，对阶梯函数构造进行优化
下图分别为 2016 年 Haugland（挪威数学家）、2025 年 5 月 AlphaEvolve（Google DeepMind 开发的 AI 智能体）、2026 年 1 月 TTT-Discover（斯坦福联合英伟达发布的 AI 科学问题发现 SOTA 解决方案）以及本文解决方案的结果对比。

针对 Erdos 最小重叠问题，以上四种解决方案得出的上界（upper bound）分别如下：

完整的验证过程与额外分析详见以下链接：
https://github.com/togethercomputer/erdos-minimum-overlap/blob/main/analysis.ipynb
网友热议：是新科研范式还是噱头？
对于现实世界人类科学家的「智能体分身」，不少评论认为这是一种新的科研协作范式。
「这正是我通过 SOUL.md 为每个智能体赋予独特角色的原因，不同的个性不仅增添了趣味，还能产生不同的推理路径。一个怀疑论者和一个乐观者会从完全不同的角度来攻击同一个问题。」

「拥有各自鲜明人格的智能体各自独立工作，没有会议、没有同步沟通，只是并行推进，让结果自己说话。这种内向型协作方式通过减少协调成本，仅用 30 分钟就解决了一个数学问题，而传统依赖大量沟通协调的方式却没能做到。」

不过，也有人对此泼了冷水。
「我粗略看了一下这个仓库，它看起来只是一个被包装得更复杂的提示系统。告诉一个模型它是非常聪明的物理学家，并不会真的让它变成一个非常聪明的物理学家。它本质上还是同一个模型。这里的做法似乎更糟，因为现在大模型还要先思考：某个角色会如何回答？而不是直接思考：我应该如何回答？。本质上，这相当于在真正有洞见的步骤（讨论物理）之前，多增加了一个制造噪声的步骤（假装自己是爱因斯坦）。」

评论区的各位，如何看待这种智能体协作模式呢？

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

新能源汽车静默革命：从轰鸣到低语，聆听未来的声音图景

CJ2026京东展区大揭秘：新潮数码与前沿科技共筑玩家乐园

韩寒出任荣耀影像创想家荣耀Robot Phone发布会定档8月12日

小米VS华为！澎程新车对标问界，智界RX盯上小米YU7

出走米哈游1000多天后，蔡浩宇的AI远征“撞墙”

华为深圳场景化解决方案发布，破解“模型强、场景弱”难题

全站最新

新能源汽车静默革命：从轰鸣到低语，聆听未来的声音图景

CJ2026京东展区大揭秘：新潮数码与前沿科技共筑玩家乐园

韩寒出任荣耀影像创想家荣耀Robot Phone发布会定档8月12日

三菱全新帕杰罗或9月2日发布，外观、动力等细节抢先看！

热门推荐

国产机器人产业加速出海，国内现存相关企业超115万家

国产机器人产业加速出海，国内现存相关企业超115万家

字节跳动Seedance 2.5发布：视频创作升级，支持30秒生成与多素材参考

2026年Q2全球智能手机出货量降6%：三星苹果领涨，小米等厂商承压

植物无大脑却能“对话”“预言”？重新认识地球生命信息网络中的它们

2026年7月手机圈大事件：苹果基带混用红米新机将至小米份额上升 OPPO新机万元起

消息称OPPO或推6.3-6.4英寸阔直屏新机预计与Ultra同档明年亮相

谷歌DeepMind再发力：新一代机器人AI模型攻克全身控制与灵巧操作难题

谷歌Gemini Robotics 2发布：单模型驱动全身自由度，开启机器人通用智能新篇

字节跳动Seedance 2.5发布：30秒生成高质量视频，优化连贯性还去“油腻感”

AI浪潮下企业变革：字节飞书调整，豆包成新增长引擎接棒前行

模型激战正酣，亚马逊云科技另辟蹊径率先收获AI商业硕果

字节跳动Seedance 2.5发布：视频时长延长至30秒，创作能力全面升级

B站运营“社区派”代表林航离职曾为即刻社区风格奠基人

谷歌推出三AI模型助力机器人进化：全身智控、多机协作，解锁多样任务新场景