随着大语言模型(LLM)和视觉 - 语言模型(VLM)的迅速发展,智能体在知识发现和问题解决的方式上正在经历革命性的变化。然而,许多现有的开源智能体框架过于依赖昂贵的付费工具,这在很大程度上限制了它们的可复现性和普适性。为此,腾讯 AI Lab 推出了全新开源的智能体框架 ——Cognitive Kernel-Pro,旨在最大限度地降低外部依赖,使更多研究人员和开发者能够轻松参与智能体的开发和训练。
Cognitive Kernel-Pro 采用了多模块、层次化的设计,主要由主智能体和多个子智能体组成。主智能体负责任务分解和信息整合,而子智能体则专注于特定任务,如网页浏览和文件处理。这种模块化结构确保了各部分的独立性和扩展性。
为了提升复杂任务的处理效率,Cognitive Kernel-Pro 引入了 “进度状态” 机制,智能体可以记录已完成的步骤和待办任务。此外,框架通过简单的文本接口实现主智能体和子智能体之间的高效通信,便于协作与调试。同时,反思和投票机制的引入,进一步优化了智能体的任务完成质量,特别是在网页浏览等高随机性的任务中。
在性能方面,Cognitive Kernel-Pro 在 GAIA 基准测试中表现出色,超越了其他开源框架 SmolAgents,接近那些依赖付费工具的智能体。这一成果得益于其创新的训练方法,涵盖网页导航、文件处理和推理等多个领域。
除了强大的框架设计,腾讯 AI Lab 还提供了 Agent Foundation Model 的训练配方,进一步推动了社区的研究和发展。相关代码和技术报告已在 GitHub 上公开,供大家共同探索与利用。
项目地址:https://github.com/Tencent/CognitiveKernel-Pro