新智元报道
编辑:KingHZ
在5月中旬,谷歌发布了AlphaEvolve。不仅30天内攻克了18年未解的难题,或将开启了一场无需「灵感」的科学革命:未来,科学家将不再依赖直觉,而是靠AI解决难题!
利用Gemini模型,它发现全新的算法。
对此,知名华人数学家陶哲轩略感惊讶。
不仅在计算机科学和数学取得重大进展,AI甚至可能影响到更广泛的科学领域。
它不仅仅是生成文本工具,更不是简单的模板生成器。它喻示了AI的无限可能,就像AlphaGo的「神之一手」,展现了人类从未做过的突破。
这甚至可能是迈向AI自我改进的一步。
在深度对话中,华人投资家Sarah Guo(郭睿)采访了谷歌DeepMind科学与战略副总裁Pushmeet Kohli(下图左),以及研究科学家Matej Balog(下图右)。
他们分享了AlphaEvolve的背后故事。 除了数学和计算机科学,他们也进一步畅想:AlphaEvolve背后的理念,是否还能颠覆更多基础科学领域?
AlphaEvolve证明靠智能取代「运气」,也能颠覆科学。 AlphaEvolve,或许正开启一场不靠「灵感」的科学革命。
AlphaEvolve:陶哲轩震惊的进步
DeepMind的使命是负责任地构建人工智能,造福人类。这些年来,DeepMind一直在科学领域寻找新算法。
AlphaEvolve有什么不一样?
Pushmeet Kohli认为区别可以从历史上来看。
一切从AlphaGo说起。
AlphaGo不仅能够高效地探索围棋的所有可能局面,而且能够提出当时最佳走法。在几十年的围棋历史中,人类都没有发现这种下法。
某种意义上,AlphaGo是AI智能体。在庞大的搜索空间中,它可以高效探索并提出最优解。这种能力让人们感到惊讶,因为围棋非常复杂,科学家们认为AI能够在这一领域取得突破还需要很长时间。
从AlphaGo的工作中,DeepMind得到启发:
如果AI能够如此高效地搜索围棋的所有可能局面,那么是否可以利用类似的思想去搜索算法空间呢?
这就是开始研发AlphaTensor工作的基础。
几十年来,人们认为矩阵乘法的复杂度是立方级别的。也就是说,如果你有两个矩阵,矩阵的维度是n,那么计算的时间复杂度是n³。
50多年前,德国数学家Strassen提出了一种非常反直觉的方法,证明了:实际上,矩阵乘法的复杂度比原来预想的要低。
通过搜索,AlphaTensor发现了比之前所知的算法更高效的解决方案。它不仅在效率上超越了传统算法,而且这个结果还证明了AI可以实现超人级别的突破。
但问题是,AlphaTensor专门针对矩阵乘法设计。那么,能否将这种方法推广到更一般的问题中呢?这就引出了对AlphaEvolve的进一步探索。
AlphaEvolve不仅能够处理特定的任务,它更具普适性,可以处理更广泛的问题。
AlphaEvolve利用了与AlphaTensor相似的进化算法。但它不再局限于矩阵乘法的特定问题,而是能够在更广泛的编程空间中搜索,提出解决方案。
不断进化,自我改进
听起来AlphaEvolve类似于进化选择对吧?它是如何进行每一代的改进的?
在每一代过程中,AlphaEvolve不断改进,每一代都基于上一代的强解进行优化。
通过基因池和评估函数,确保每一代的改进都能够提高整体的解的质量,同时保持了多样性,以便在庞大的搜索空间中发现最佳解决方案。
那这种进化过程的规模如何呢?如何控制模型的迭代次数?
关于这个问题,AlphaEvolve有一个很棒的特性,就是它能够适应问题的难度。
如果AlphaEvolve被要求解决一个相对简单的问题,它几乎能立即得到答案;但如果是一个非常复杂的问题,那么解决方案可能需要更长时间,更多的代次来不断改进。
但令人欣慰的是,AlphaEvolve可以持续改进,即使是在面对难度极大的问题时,它仍能不断提高。
这非常有价值,因为在持续优化时,许多传统的系统往往会在早期就遇到瓶颈,无法继续改进。
至于预测需要多少代才能达到最优解,这个问题比较复杂。问题的难度,无法预料,尤其是在科学领域,一些看似简单的问题实际上可能非常难,反之亦然。但幸运的是,只要持续运行AlphaEvolve,它会随着时间的推移不断得到更好的结果。
对编码智能体的意义
与一般的编码智能体相比,AlphaEvolve有何不同之处?
与一般的编码智能体相比,AlphaEvolve的优势在于它能够处理更复杂的任务,并且具有更高的效率和创造性。
在面对复杂或模糊的任务时,大多数通用编码智能体,容易陷入困境或产生错误,因为它们通常依赖于直接的任务说明,而这些说明往往不够精确,或者它们没有很强的判断能力。
而AlphaEvolve则依赖严格的评估函数。它能够区分有效的解决方案与无效的解决方案。
它的「创造性」不仅仅体现在提出新算法上,还表现在对解决方案进行有效评估和优化的能力上。
每当提出一个新解决方案时,评估函数会帮助判断它是否有效。
例如,在优化数据中心调度时,评估函数可能是一个模拟器,它能够根据给定的调度算法来判断该算法在现实中的表现如何。
这个评估过程帮助Alpha Evolve更准确地搜索解决方案空间。
那对于开发者来说,设计好的评估函数确实非常具有挑战性。你需要明确什么样的结果才是好的解决方案。在某些情况下,开发者可以使用现有的模拟器来进行评估,而在其他更复杂的情况下,可能需要开发定制化的评估工具。
评估函数不仅要能判断方案的好坏,还要能够在不同的任务中灵活应用。比如,在数据中心调度优化问题中,评估函数的复杂性可能远高于一些较简单的任务。
这也是为什么强调评估函数在AI系统中的重要性,只有拥有了精确的评估函数,AI才能有效地进行创新。
左图:AlphaEvolve为谷歌的工作负载和容量量身定制的启发式函数;右图:对该启发式评分函数的可视化展示
科学家转变角色
Matej Balog和Pushmeet Kohli都认为:未来,科学家的角色会发生一些变化。
可以想象,在未来,科学家们将更多地专注于如何定义问题、设计评估函数,以及如何解释AI生成的结果。
AI将成为科学家们的强大工具,帮助他们更快解决复杂的问题。
AI不仅仅给出答案,还提供算法,科学家们可以通过研究算法来理解背后的原理,这对于深入理解问题和解决方案非常重要。
这正是AlphaEvolve称霸多个领域的原因。
数学家和科学家不仅能看到最终的解决方案,还能理解到达这个解的路径,这种新的视角对推动科学发展至关重要。
AlphaEvolve不仅仅推动技术创新,还有助于科学家发掘新的思维方式,挑战现有的认知框架。
AlphaEvolve的问世,标志着科学研究进入了一个崭新的时代。它不仅在算法领域创造了奇迹,更为未来的科学革命铺设了道路。
在AlphaEvolve的推动下,或许我们即将见证:科学,不再依赖「灵感」,而是靠「智能」。
参考资料:
https://www.youtube.com/watch?v=2Fs6VZpsiMQ