![]()
机器之心报道
编辑:泽南
从「执行者」到「发明家」,AI 进化的幅度又加快了。
这就是未来解决难题的方式?
只要你输入自然语言指令和必要的数据,一群智能体就可以针对复杂问题设立项目进行研究,自己去寻找解法。

不论是金融、交通还是港口物流领域,人类专家需要几十天才能完成的工作,使用 AI 智能体只需要几天甚至几小时,还能找出更优的解法。


这一系列效率的提升,都来自于昨天百度世界大会上新发布的全球首个可商用、自我演化超级智能体百度伐谋,由百度智能云团队打造。目前,伐谋已正式对外开放,并通过邀请码的形式提供服务。
在大会现场,李彦宏表示,这是一个全新的、能自我进化的智能体,能够在各种重要工业应用场景中自动找出全局最优解,「只要问题的解法是明确可验证的,伐谋就可以模拟甚至超越顶尖的算法专家。」

从入门的代码生成,到高阶的全业务流程优化,ChatGPT 出现还没满三年,AI 就已经实现了能力维度上的扩展,实现了从「执行指令」到「自主发现」的跨越,甚至还能发现人类无法想到的解决方案。
四大核心技术
打造 AI 优化引擎标杆
伐谋是一个让 AI 算法自主进化、寻找全局最优的多智能体系统,可以高效率地解决高难度的问题。它结合了大语言模型和进化搜索算法,旨在通过大语言模型的推理能力与大规模进化搜索来解决复杂的现实世界问题。
面对现实世界的复杂问题,如何能让 AI 代替算法工程师来寻找解法,并进行调优,是一个很有挑战的任务。
百度智能云团队发布了伐谋(FM Agent)的技术报告,我们可以从中了解其主要的技术特点。
![]()
伐谋系统在处理复杂算法问题时的工作流程。
技术报告链接:https://arxiv.org/abs/2510.26144
整体来看,伐谋具备跨领域、端到端的自动化问题求解能力,涵盖以下四大场景:
机器学习——包括自动化特征工程、特征组合、模型融合;可实现端到端构建机器学习流程,无需人工干预。组合优化——可以自主设计启发式算法、增强传统求解器(如 MIP、CP)的能力,直接生成高质量解。GPU 内核生成——能自动优化 CUDA 内核,提升计算效率,在 KernelBench 上实现 2 倍到 20 倍的加速。数学问题求解——在圆填充、不确定性不等式、距离比最小化等问题中达到 SOTA;可以结合符号推理与进行数值优化。
在工作的整体逻辑上,伐谋在收到指令后首先使用智能体寻找算法,选择优势品种进行进化,在这其中应用的方法既包括经典的专家策略,也有 AI 搜索,在这之后,生成的方法会被组合成为一个复杂的 prompt 交给大模型,形成一个新算法。新的算法会交给到人类写好的评估器上判断质量,打分会作为依据交给下一轮的再采样生成。
在技术方面,伐谋具有四大核心技术特点:
首先是冷启动初始化,伐谋使用多个生成智能体并行构建高质量、多样化的初始解集,可以利用「专家引导」模式加速收敛。其次是自适应多样性采样,伐谋的 Agent 会使用多岛屿并行的方式进化模型,每个岛屿独立演化,通过动态调整探索与利用的平衡,避免早熟收敛。这是关键的一步,可以快速生成多样性的方法。在生成解法后,领域专用评估器会对生成功能的正确性、运行效率、LLM 质量进行判断,支持多维度的反馈。最后,伐谋依托的分布式异步基础设施基于 Ray 框架,支持大规模的并行演化。
使用昆仑芯一体机进行运算,难度较大的任务可能需要数十小时、几天的求解时间,简单的任务可能只需要几小时。
报告显示,伐谋在多个领域都有出色的表现,在多个权威基准测试中都取得了领先的性能。在 MLE-Bench 上达到了 43.56% 的奖牌率,比人类中位数高出 51.56%;在 ALE-Bench 上得分为 1976.3,比专门设计的 ALE-Agent 高出 5.2%;在 KernelBench 上则实现了 2.08 到 20.77 倍的加速比。
![]()
需要注意的是,所有实验均是全自动运行的,没有人类干预。伐谋在打榜时也没有针对 Benchmark 进行针对性的优化。
目前能看到一些学术上的同类工作,大多集中于单点问题上,而如何在实际场景中解决问题、提升效率,才是伐谋关注的重点。伐谋的产品负责人表示,伐谋在很多一个月才能解决的复杂问题上优势更大。
如果做一个比喻的话,在各行各业的专家团队中,应用 AI 以前需要专家团队自己来写算法,应用伐谋之后,相当于有了数倍的算法工程师一起来写算法,他们能够生成的算法水平更好。
另外,随着业务的落地,AI 生成的方法可以持续进行动态调整,打磨出更好的效果。可以说,伐谋不仅推动了智能体的技术发展,也为企业 AI 技术落地提供了可行的工程范本。
面向产业级应用
AI 自主优化引擎,已在大规模落地
作为面向实际的 AI 优化引擎,伐谋在很多行业生产、研发场景中的重要环节上都能展现能力,它能够自动将实际问题抽象成数学算法问题进行解决。
在这个过程中,AI 提出的评估指标明确,产生的解决方案价值很高,而且可以持续迭代优化。伐谋能够搞定的领域包括但不限于:路径规划、过程控制、排产调度、资源优化、机器学习和性能优化。
![]()
输入必要的数据并使用自然语言给出指令,伐谋就可以对问题进行准确的理解,自行提出思路进行解决和优化。伐谋利用大语言模型作为核心,并支持代码生成,可以修改代码文件。在生成解决路径的过程中,伐谋擅长于平衡对新算法的探索,在生成解法的过程中鼓励多样性。
它会使用自动化评估机制对生成的程序进行评分,这些评估结果也会被用于指导后续的代码生成。这样,就形成了一个「抽象 - 建模 - 演化」的智能闭环。
百度的工程师表示,伐谋旨在解决那些难度极大、人类解决得不太好的问题。基于人类专家们的知识,伐谋的自动输出就像是给人类智慧进行了 Scaling Up。
目前,伐谋已经在很多场景中展示了能力:
在金融领域,伐谋在中信百信银行的风控特征挖掘与建设的过程中获得了验证,其提出的方法将风险区分度提升了 2.41%,处理速度还比常规方法更快,特征挖掘效率提升了 100%。在城市交通领域,伐谋通过对于上千红绿灯的大规模优化求解,能够精准找到红绿灯配时的「全局最优解」,提升了整体交通效率。在超级工程领域,面对海上风电「三维迷宫」般的电缆布置难题,伐谋产出高质量的优化方案,找到了比人工设计更短的电缆路径,项目交付节省数倍时间。伐谋还正在水务、物流、能源等领域中进行测试,预期可以在很多环节中实现优化,进而降低能耗,提升工作效率。
此外在 AI 的性能优化上,百度正在利用伐谋优化 LayerNorm、FlashAttention 等 CUDA 算法,据说比 PyTorch 官方实现的速度还要更快。
随着大模型分析、推理能力提升,我们可以逐渐地把评估,Coding 等任务交给 AI。解决复杂问题的多个步骤,现在可以被智能体加外部环境构成的系统进行接管。
一个新的范式正在逐渐形成 —— 由人类来定义问题,发现和抽象需求,AI 来负责进行实践。
进化式智能体
AI 发展新趋势
在 AI 前沿领域,能够进化式编程的智能体已经成为新的发展方向。利用 AI 大模型的能力,多智能体系统能够自主生成、测试并迭代优化算法,甚至发现全新的算法,这标志着 AI 在算法优化和编程领域迈出了突破性的一步。
相比于基于数学、运筹学的求解器与单一大模型系统,自主优化的智能体可以解决更多、更复杂的问题,提出创新形式的解法,同时还降低了对于使用者专业知识的门槛。
其中的典型就是今年 5 月谷歌 DeepMind 发布的 AlphaEvolve,这是一款用于发现和优化通用算法的平台,基于 Gemini 大语言模型与进化算法策略开发,具备自主生成和优化通用算法的能力。AlphaEvolve 正式发布之前,谷歌已经在内部进行了落地,它能把大模型加速注意力算法 FlashAttention 的核心效率提升 32.5%,还优化了 50 年没有改进的矩阵最佳算法。
![]()
AlphaEvolve 帮助谷歌构建了更高效的数字生态系统,从数据中心调度、硬件设计到 AI 模型训练都有涉足。
上周,著名数学家陶哲轩在其新研究中展示了 AlphaEvolve 自主发现数学构造的能力,AI 方法推动了人们对长期未解数学难题的理解。
可见,在一些真实世界的复杂任务上,智能体已经可以帮助人们高效率地解决问题了。如果这种技术大规模应用,可以在很多领域上为人们带来生产力的提升。
不过,此前我们看到 AI 解决复杂问题的能力,主要面向的是科学研究领域,而百度新发布的伐谋作为全球首个同类商业化产品,更加面向行业,还做到了更全面、更加自动化。
AI 革新生产力
布局才刚刚展开
李彦宏表示:「当 AI 能力被内化,成为一种原生的能力,智能就不再是成本,而是生产力。AI 能够提升决策质量、发现新增长点,让成本更低、利润率更高、创新周期更短。」
不论是从技术角度,还是从实用的角度看,伐谋都是一款通用、强大且可扩展的智能体框架,引领了目前 AI 大规模技术落地的前沿方向。
如今,智能体正在从与我们「对话」走向帮我们「决策」。从已经出现的落地案例来看,还有很多各行各业的关键生产环节有能被 AI 优化的潜力。
在百度看来,目前基于 AI 的自主优化引擎仅仅处于落地的初期。随着标杆客户的验证,AI 的优化能力会在业务链条上的每个环节上逐渐显现。
伐谋的能力,将会服务于千行百业。
据百度介绍,百度伐谋发布首日已经吸引了超 1000 家企业申请接入测试,覆盖交通、能源、金融、物流等行业。目前百度伐谋测试名额持续开放中,首批将通过邀请码形式优先向具有高复杂决策需求的企业开放。





京公网安备 11011402013531号