当前位置: 首页 » 资讯 » 新科技 » 正文

腾讯开源智能体新框架:不用训练无需充值,用开源模型实现SOTA Agent

IP属地 中国·北京 编辑:苏婉清 量子位 时间:2025-09-02 20:19:15

腾讯优图实验室 投稿

量子位 | 公众号 QbitAI

智能体(Agent)正成为大模型落地的关键载体。无论是研究探索还是实际应用,高效、易用、可复现的智能体框架,都是推动智能体生态发展的基础设施。

然而,研究者和开发者却常常遇到一些难题:例如上手门槛高、依赖环境复杂、实验难以复现,以及动辄需要训练模型或者充值海外昂贵的闭源模型API才能取得可靠的效果表现

为此,腾讯优图实验室正式开源Youtu-agent——一个简单而强大的智能体框架,兼顾极简设计与高性能表现,既能服务科研基线需求,也能支撑实际应用构建,最重要的是不需要训练模型、不依赖闭源API,就能取得极佳的效果表现

在多个挑战性基准上,Youtu-agent已展现出领先的性能:

WebWalkerQA:基于DeepSeek-V3.1达到71.47%准确率,刷新开源效果SOTA;

GAIA(文本子集):基于DeepSeek-V3 Pass@1达到72.8%,不用充值Claude/GPT等闭源模型,验证了强大的研究和应用潜力。

这意味着,Youtu-agent在完全开源可复现的条件下,已经接近甚至超越部分依赖付费工具的智能体框架。

开箱即用

总体来看,Youtu-agent具有以下核心亮点

1、开源友好&成本敏感

完全基于开源生态,不依赖封闭模型,适配可访问、低成本的部署环境。

2、灵活架构

构建于openai-agents之上,兼容DeepSeek、gpt-oss等多类模型API与工具集。

3、自动智能体生成

基于YAML配置和“元智能体”对话机制,用户只需描述需求,即可一键生成并运行智能体配置。

4、简洁高效

模块化+异步化设计,支持streaming、tracing与agent-loop,高效调试与扩展。

更关键的是Youtu-agent 并非实验室里的“纸上框架”,而是面向真实场景的即用型智能体工具。

研究团队梳理了四个典型案例,覆盖文件管理、数据分析、学术研究与广域综述,展示了框架的灵活性与实用性。

案例1:本地文件管理

在助教批改作业的场景中,用户只需将学生提交的文件放入指定文件夹。Youtu-agent启动后会依次扫描所有文件,首先判断格式是否为PDF。

如果是PDF,则根据规则自动重命名为“学号-姓名”的规范格式;如果不是PDF,则将其归档到独立的文件夹。整个过程无需人工干预,从文件识别到命名再到分类归档,一气呵成。

案例2:数据分析

当面对Kaggle数据集中的cat_breeds_clean.csv文件时,用户只需给出路径。Youtu-agent读取CSV内容,经过数据清洗和统计分析后,会自动生成结构化的结论与趋势,并转化为一份直观的 HTML 报告。

这个过程中,原始数据被逐步转化为高价值的信息:从表格读取、到统计提取、再到结果可视化,形成完整的流水线。

案例3:论文分析

在科研工作中,研究者只需输入一篇PDF论文。Youtu-agent 首先解析文档内容,抽取核心部分;随后调用搜索工具,在外部检索与其相关的研究工作;最后将论文解读与外部成果整合,生成一份Markdown报告。

整个过程就像一个“论文助理”:先读懂论文,再去查找对照,最后写出一份条理清晰的研究笔记。

案例4:Wide Research

当用户输入一个广域主题时,Youtu-agent便进入复合模式。它先调用搜索工具,收集大量分散的信息;再使用文档处理工具进行整理;最后由智能体进行分析与总结,生成一份结构化的Markdown综述。

这个过程相当于把“调研”自动化:从需求提出,到海量资料收集,再到报告成型,整个链条由多个子智能体协同完成。

设计原则:DITA

Youtu-agent的研究员提出了DITA原则,总结智能体设计的四个关键维度:

Demand(需求):明确任务目标,来源于系统提示词中的requirements或用户输入的intention。

I/O(输入输出):定义任务的输入形式(如CSV、PDF、str)与输出形式(如HTML报告、Markdown)。

Tools(工具):根据任务选择或生成合适的工具,例如搜索工具、文件处理工具。

Agent Pattern(范式):决定智能体的交互模式,例如single agent、plan-and-execute、compound。

自动化Agent生成

除了DITA框架之外,Youtu-agent还特别强调了一个核心亮点:自动化Agent生成

在传统方式中,用户往往需要自己手动编写prompt、配置工具和参数,这不仅对初学者来说存在较高的使用门槛,而且即使是有经验的用户,也要投入大量的时间成本。Youtu-agent的解决思路是将这一过程进行标准化与自动化。

具体来说,它采用统一的YAML配置格式,将Agent的输入输出、工具调用和交互范式用结构化的方式加以描述;同时引入了一个“meta-agent”,用户只需提出任务需求,系统就会通过与用户的交互澄清意图,并自动生成完整的配置文件。生成的配置可以直接加载并运行,从而实现一键测试与使用。

在使用体验上,用户只需先运行python s/gen_simple_agent.py,meta-agent会根据需求生成相应的配置;随后再运行 python s/cli_chat.py —stream —config generated/xxx,就能立即启动并测试生成的 Agent。这一机制大幅度降低了 Agent 的定制难度,让初学者可以快速上手,同时也帮助高阶用户节省了繁琐的配置和调试时间。

(交互式对话,meta-agent 会澄清需求并输出配置)

or, `make sync`cp.env.example .env# config necessary API keys...source./.venv/bin/activate

第二步:跑一个最简单的智能体

Youtu-agent内置了配置模板,只要写一个YAML文件,就能定义你的智能体行为。项目中提供了一个搭载搜索工具的基础agent模板configs/agents/default.yaml,你可以运行下面的代码一键体验:

python s/cli_chat.py--stream--configdefault

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。