陶哲轩看傻：三破18年数学纪录！谷歌推出「AI爱迪生」，科研不再靠灵感？

IP属地中国·北京 编辑：沈瑾瑜 ITBEAR 时间：2025-07-13 19:01:23

新智元报道
编辑：KingHZ
在5月中旬，谷歌发布了AlphaEvolve。不仅30天内攻克了18年未解的难题，或将开启了一场无需「灵感」的科学革命：未来，科学家将不再依赖直觉，而是靠AI解决难题！
利用Gemini模型，它发现全新的算法。
对此，知名华人数学家陶哲轩略感惊讶。
不仅在计算机科学和数学取得重大进展，AI甚至可能影响到更广泛的科学领域。
它不仅仅是生成文本工具，更不是简单的模板生成器。它喻示了AI的无限可能，就像AlphaGo的「神之一手」，展现了人类从未做过的突破。
这甚至可能是迈向AI自我改进的一步。
在深度对话中，华人投资家Sarah Guo（郭睿）采访了谷歌DeepMind科学与战略副总裁Pushmeet Kohli（下图左），以及研究科学家Matej Balog（下图右）。
他们分享了AlphaEvolve的背后故事。除了数学和计算机科学，他们也进一步畅想：AlphaEvolve背后的理念，是否还能颠覆更多基础科学领域？
AlphaEvolve证明靠智能取代「运气」，也能颠覆科学。 AlphaEvolve，或许正开启一场不靠「灵感」的科学革命。
AlphaEvolve：陶哲轩震惊的进步
DeepMind的使命是负责任地构建人工智能，造福人类。这些年来，DeepMind一直在科学领域寻找新算法。
AlphaEvolve有什么不一样？
Pushmeet Kohli认为区别可以从历史上来看。
一切从AlphaGo说起。
AlphaGo不仅能够高效地探索围棋的所有可能局面，而且能够提出当时最佳走法。在几十年的围棋历史中，人类都没有发现这种下法。
某种意义上，AlphaGo是AI智能体。在庞大的搜索空间中，它可以高效探索并提出最优解。这种能力让人们感到惊讶，因为围棋非常复杂，科学家们认为AI能够在这一领域取得突破还需要很长时间。
从AlphaGo的工作中，DeepMind得到启发：
如果AI能够如此高效地搜索围棋的所有可能局面，那么是否可以利用类似的思想去搜索算法空间呢？
这就是开始研发AlphaTensor工作的基础。
几十年来，人们认为矩阵乘法的复杂度是立方级别的。也就是说，如果你有两个矩阵，矩阵的维度是n，那么计算的时间复杂度是n³。
50多年前，德国数学家Strassen提出了一种非常反直觉的方法，证明了：实际上，矩阵乘法的复杂度比原来预想的要低。
通过搜索，AlphaTensor发现了比之前所知的算法更高效的解决方案。它不仅在效率上超越了传统算法，而且这个结果还证明了AI可以实现超人级别的突破。
但问题是，AlphaTensor专门针对矩阵乘法设计。那么，能否将这种方法推广到更一般的问题中呢？这就引出了对AlphaEvolve的进一步探索。
AlphaEvolve不仅能够处理特定的任务，它更具普适性，可以处理更广泛的问题。
AlphaEvolve利用了与AlphaTensor相似的进化算法。但它不再局限于矩阵乘法的特定问题，而是能够在更广泛的编程空间中搜索，提出解决方案。
不断进化，自我改进
听起来AlphaEvolve类似于进化选择对吧？它是如何进行每一代的改进的？
在每一代过程中，AlphaEvolve不断改进，每一代都基于上一代的强解进行优化。
通过基因池和评估函数，确保每一代的改进都能够提高整体的解的质量，同时保持了多样性，以便在庞大的搜索空间中发现最佳解决方案。
那这种进化过程的规模如何呢？如何控制模型的迭代次数？
关于这个问题，AlphaEvolve有一个很棒的特性，就是它能够适应问题的难度。
如果AlphaEvolve被要求解决一个相对简单的问题，它几乎能立即得到答案；但如果是一个非常复杂的问题，那么解决方案可能需要更长时间，更多的代次来不断改进。
但令人欣慰的是，AlphaEvolve可以持续改进，即使是在面对难度极大的问题时，它仍能不断提高。
这非常有价值，因为在持续优化时，许多传统的系统往往会在早期就遇到瓶颈，无法继续改进。
至于预测需要多少代才能达到最优解，这个问题比较复杂。问题的难度，无法预料，尤其是在科学领域，一些看似简单的问题实际上可能非常难，反之亦然。但幸运的是，只要持续运行AlphaEvolve，它会随着时间的推移不断得到更好的结果。
对编码智能体的意义
与一般的编码智能体相比，AlphaEvolve有何不同之处？
与一般的编码智能体相比，AlphaEvolve的优势在于它能够处理更复杂的任务，并且具有更高的效率和创造性。
在面对复杂或模糊的任务时，大多数通用编码智能体，容易陷入困境或产生错误，因为它们通常依赖于直接的任务说明，而这些说明往往不够精确，或者它们没有很强的判断能力。
而AlphaEvolve则依赖严格的评估函数。它能够区分有效的解决方案与无效的解决方案。
它的「创造性」不仅仅体现在提出新算法上，还表现在对解决方案进行有效评估和优化的能力上。
每当提出一个新解决方案时，评估函数会帮助判断它是否有效。
例如，在优化数据中心调度时，评估函数可能是一个模拟器，它能够根据给定的调度算法来判断该算法在现实中的表现如何。
这个评估过程帮助Alpha Evolve更准确地搜索解决方案空间。
那对于开发者来说，设计好的评估函数确实非常具有挑战性。你需要明确什么样的结果才是好的解决方案。在某些情况下，开发者可以使用现有的模拟器来进行评估，而在其他更复杂的情况下，可能需要开发定制化的评估工具。
评估函数不仅要能判断方案的好坏，还要能够在不同的任务中灵活应用。比如，在数据中心调度优化问题中，评估函数的复杂性可能远高于一些较简单的任务。
这也是为什么强调评估函数在AI系统中的重要性，只有拥有了精确的评估函数，AI才能有效地进行创新。
左图：AlphaEvolve为谷歌的工作负载和容量量身定制的启发式函数；右图：对该启发式评分函数的可视化展示
科学家转变角色
Matej Balog和Pushmeet Kohli都认为：未来，科学家的角色会发生一些变化。
可以想象，在未来，科学家们将更多地专注于如何定义问题、设计评估函数，以及如何解释AI生成的结果。
AI将成为科学家们的强大工具，帮助他们更快解决复杂的问题。
AI不仅仅给出答案，还提供算法，科学家们可以通过研究算法来理解背后的原理，这对于深入理解问题和解决方案非常重要。
这正是AlphaEvolve称霸多个领域的原因。
数学家和科学家不仅能看到最终的解决方案，还能理解到达这个解的路径，这种新的视角对推动科学发展至关重要。
AlphaEvolve不仅仅推动技术创新，还有助于科学家发掘新的思维方式，挑战现有的认知框架。
AlphaEvolve的问世，标志着科学研究进入了一个崭新的时代。它不仅在算法领域创造了奇迹，更为未来的科学革命铺设了道路。
在AlphaEvolve的推动下，或许我们即将见证：科学，不再依赖「灵感」，而是靠「智能」。
参考资料：
https://www.youtube.com/watch?v=2Fs6VZpsiMQ

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

【新书】《生命传》：基因不是答案，而是问题的开始

“飞天”健身器上天！青岛英派斯为航天员健康护航

空客最畅销窄体客机首次在中国进行高难度机身系统装配

向新而行·育见未来丨武汉：打造人形机器人完整生态体系为全球具身智能发展提供 “武汉方案”

宇树科技王兴兴亮相国新办：未来3至5年，人形机器人应用将加速

机器人共舞“智”造“新”时刻

全站最新

日本航天机构报告H3火箭发射失败可能的原因

广汽集团成立具身智能机器人公司慧仑科技，拟2027年规模化量产

汉堡王推出AI监工：在员工耳机中部署可检测与顾客交流的友好程度

苹果强硬回击股东集体诉讼，否认千亿美元欺诈指控

热门推荐

【新书】《生命传》：基因不是答案，而是问题的开始

“飞天”健身器上天！青岛英派斯为航天员健康护航

空客最畅销窄体客机首次在中国进行高难度机身系统装配

向新而行·育见未来丨武汉：打造人形机器人完整生态体系为全球具身智能发展提供 “武汉方案”

宇树科技王兴兴亮相国新办：未来3至5年，人形机器人应用将加速

机器人共舞“智”造“新”时刻

黄仁勋：中国有非常独特的优势发展人形机器人

迎接下一个AI浪潮，近千只机器人概念股集体“躁动”

武汉市力争2027年人形机器人产业规模超100亿元

对话 | 做“金字塔尖”的手术机器人

“传递能量方块”开启！未来一个月机器人将在北京街头“快闪”

聚焦人形机器人关键领域开展技术创新，多位湖北省政协委员建言科技创新和产业创新融合发展

古人发明的3大“奇技淫巧”，有的物件，放到现在仍算是高科技

《疫苗冷链上链：99.6%合规率背后的物联网+区块链融合》

折叠屏手机选购指南：这三款旗舰让你一手掌握未来科技