新智元报道
编辑:定慧 Aeneas
百度版Deep Research(百度千帆深度研究Agent)横空出世,首秀即拿下权威榜单TOP 1。当AI真正学会「做研究」,金融、科研等高净值行业的游戏规则,全球千亿美元市场正在被彻底改写。
从2025到2026, Deep Research成了AI巨头们的兵家必争之地。
OpenAI押上了,谷歌押上了,Anthropic也押上了。
为什么?
因为通用聊天机器人的竞争已经卷到头了。
真正能赚钱的战场,是金融研报、科研综述、投研咨询这些高价值场景。
而这些场景需要的,不是能聊天,是能把复杂问题研究明白。
这正是Deep Research要解决的问题!
就在这个节骨眼上,百度出手了。
2月4日,深度研究智能体权威评测榜单DeepResearch Bench公布最新结果,百度千帆深度研究Agent直接登顶榜首,一举超越OpenAI、Gemini、Claude等一众国际顶尖选手的同类产品。
在2026年这个Agentic AI爆发元年,Deep Research已经成为大模型落地高净值行业的胜负手。
百度,拿下关键一局。
注意,这次千帆深度研究Agent的夺冠,并不是「刷分」意义上的领先,而是硬核能力的体现。
在衡量研究报告「含金量」的 四个核心维度——全面性、洞察力、指令遵循度、可读性上, 千帆深度研究Agent全面领跑。
这就传达出一个信号:AI,已经从「信息搬运工」,迈向真正的「研究型智能体」。
DeepResearch Bench
这个榜单凭什么权威?
在DeepResearch Bench上, 千帆深度研究Pro和 千帆深度研究分别拿下 第一和第二。
DeepResearch Bench是一个专为深度研究智能体设计的综合性基准测试,由学术界和业界共同推动。 它的硬核之处在于:
首先,任务级别都是博士级:包含100个研究任务(中英文各50条),覆盖22个不同学科,每个任务都是领域专家设计的博士级别研究问题。
其次,这不是那种「今天天气怎么样」的简单指令,而是真正需要AI进行深度思考、广泛调研与逻辑构建的复杂课题。
体验地址:
https://console.bce.baidu.com/qianfan/studio/officialAppCenter
为什么科技巨头都在卷Deep Research?
如果把时间拨回两年前,硅谷大公司们的主战场还很清晰。
OpenAI在用ChatGPT做最强对话助手,谷歌在做搜索+大模型,Anthropic则剑指安全、可控的通用智能。
但从25年开始,一个变化越来越明显:几乎所有头部玩家,都把 最核心的Agent能力,押在了Deep Research上。
原因就在于,通用聊天机器人的竞争已经边际递减了,但Deep Research要解决,却是能不能把一件复杂、重要的问题,真正研究明白。
这直接对应着投研、咨询、法律、科研这些客单价高、付费意愿强的场景,这也正是硅谷巨头真正想要吃下来的高价值市场。
而这背后还有一个更深层次的原因: Deep Research是模型能力上限的放大器。
因为Deep Research所比拼的,不只是模型本身,真正拉开差距的,反而是长程任务规划能力、多步工具调用的稳定性、多源信息的交叉验证,以及自我反思和路径修正能力等等。
谁能稳定跑完一个几十步、充满不确定性的研究流程,谁就最接近「可用的通用智能」。
因此也可以说,Deep Research是Agentic AI的终极落地形态。
谁能把这个路线跑通,就能证明多Agent协作是可行的,长链路推理是稳定的,AI可以完成高认知密度的任务。
这对于行业客户和资本市场,都是极强的信号。
要知道,深度研究并不是「查资料+总结」这么简单,而是一个端到端的认知流程。
它的工作流动态、多步骤,而且可迭代,还具备了规划与反思能力。
在这个过程中,AI首先需要理解复杂、开放的研究需求,然后要拆解目标,广泛检索信息。在阅读、分析、交叉验证多种来源的信息后,再经过综合推理,才能输出有结构、可验证的综合研究报告。
在闯关的过程中,AI需要突破一个个核心难点。比如:
在搜索过程中,如何避免边界无限扩张,使研究失焦?或者避免边界过早收敛,错过关键信息?
面对高度不确定和复杂的研究任务,如何平衡搜索的广度和深度,避免陷入无效循环?
如何避免复杂论述中看似合理但无法追溯至信源的「幻觉」?
实测
比ChatGPT深度研究「更深度的体验」
实测后我们发现,千帆深度研究Agent把这些核心难点一一攻克了!
首先是对问题的分析更加的精细,相比ChatGPT的深度研究功能,千帆深度研究Agent给出更深入的细节和方向。
例如询问「大模型技术演进」,它不会笼统作答,而是通过多轮交互,确认你是关注「架构细节」还是「商业影响」,是面向「技术人员」还是「投资人」。
这种 「澄清式」交互, 确保了研究方向从一开始就不跑偏。
左边是千帆深度研究Agent,右边是ChatGPT
其次是过程透明。千帆深度研究Agent允许用户在开始前修改、增删大纲,让用户对研究路径拥有掌控权。
结果交付方面,专业且结构化。千帆深度研究Agent最终交付不仅仅是文本,更支持生成结构化的精美网页、Markdown文档甚至CSV数据表。
我们在实测中发现,它提供了可视化的研究路径图、交互式的推理链条追溯和关键信源的置信度标注,极大地提升了结果的可信度。
因为通关了研究边界与核心问题的动态界定、复杂任务的稳定与效率、可解释性、幻觉等挑战,千帆深度研究Agent把当前系统的能力边界,又向前推进了一层!
百度凭什么?技术内核揭秘
登顶容易,坐稳难。要想真正创造价值,必须有足够的技术实力作为支撑。
那百度千帆深度研究Agent到底有什么「独门绝技」?
千帆深度研究Agent是基于Qianfan Agent Foundry构建的端到端Deep Research Agent。
它采用的是Agentic设计架构,通过「任务理解分析-任务思考规划-任务调度执行」的循环式agentic执行设计,实现复杂的研究任务的端到端交付。
能力基石:百度搜索——别人做不到的护城河
这是百度最大的差异化优势,也是「只有百度能做,别人做不到」的点。
为什么这么说?
百度干了 25年搜索,这25年积累下来的东西,不是靠短期冲刺能追上的:信源多、覆盖广、中文语义理解深,再加上RAG(检索增强生成)领域的技术积累,这些都是护城河。
反观Deep Research赛道的其他玩家,OpenAI、Perplexity大多依赖第三方搜索API。这意味着:他们只能搜到公开网页,因此中文互联网的「信息孤岛」对他们基本是黑箱。
这些地方,藏着大量有价值的中文信息。百度搜索深耕中文互联网多年,对这些生态有独家接入能力。
正是基于这些积累,千帆深度研究Agent才能获得更高质量、更多样化的信息源,实现更精准的中文语义理解,而且在复杂研究任务中保障内容的广度和深度。
重要设计一:由粗到细的研究路径
做过研究的人都知道,研究最难的不是找资料,而是定方向。
用户提的问题往往是模糊的、开放的,研究边界从一开始就不清晰。如果一上来就扎进细节,很容易跑偏。
百度千帆深度研究Agent采用了「由粗到细」的研究路径展开机制:
第一阶段,是宏观扫描。
这样,Agent就能通过初步信息检索,形成对研究任务的全局理解,由此就建立了一个初步研究框架。
第二阶段,是精细深入。
在此阶段,Agent会基于框架设计,逐步收集和整合信息。通过全局唯一的任务调度器,能保证任务的一致性和连贯性。
基于这些框架,Agent能不断拆解、整合、调整研究节点。
这个设计的精妙之处在于:它模拟了人类研究者「先粗后细」的自然思维方式,有效应对复杂研究任务中的不确定性。
重要设计二:深度执行路径图规划+反思
光有规划不行,还得会「反思」。
很多AI系统的问题是:规划了就一条路走到黑,哪怕发现方向错了也不知道回头。
为此,百度千帆深度研究Agent设计「深度执行路径图规划+反思」机制,在每个研究节点上进行三步操作:
1. 反思:评估当前节点的成果是否符合预期
2. 调整:根据反思结果,动态调整后续研究路径
3. 细化:基于完整路径图,细化每个节点的具体执行方案
这就像一个经验丰富的研究员,边做边检查,随时校正方向,确保最终产出符合研究目标。
架构优势:Agentic架构 vs 单体/流水线
目前Deep Research领域有三种主流架构:
单体式:OpenAI DeepResearch 控制流程统一,但扩展性有限
流水线式:n8n等工作流平台模块化程度高,但对迭代任务僵化
Agentic架构:百度千帆可扩展、并行、专业化
百度千帆深度研究Agent采用Agentic架构,通过「任务理解分析→任务思考规划→任务调度执行」的循环式设计,让多个专业Agent协同工作。
这种架构的核心优势在于:
- 可扩展性强:可以根据任务复杂度动态调配Agent
- 并行效率高:多个Agent同时工作,缩短研究时间
- 专业化分工:规划、搜索、分析各司其职
对于超复杂的长程研究任务,这种架构的优势尤为明显。
Deep Research的产业价值
B端才是主战场
说到这里,必须强调一点: Deep Research的真正价值,在产业端。
对于C端用户来说,「做个研究」可能只是偶尔的需求。但对于企业和开发者而言,深度研究能力是刚需中的刚需。
如上文所言,真正能赚钱的战场,是金融研报、科研综述、投研咨询这些高价值场景。
全球金融服务咨询市场2024年的市场规模,约为279.83亿美元。加上银行、保险客户的定制研究与报告,总和可能超过1000亿美元。
数据WiseGuy Reports
全球研究行业2024年的营收,约为1400亿美元。
数据ESOMAR
2024年全球学术出版的市场,为274亿美元。
数据Growth Market Report
如果把金融研报、投研咨询(专业机构委托)、行业研究、科研综述出版等叠加考虑,全球每年价值规模最高可高达2000亿美元级别!
金融投资:从「拍脑袋」到「有据可依」
一份高质量的投研报告,可能直接影响数千万甚至上亿的投资决策。传统做法是:分析师花一周时间,翻遍公开资料、财报、研报、新闻,最后熬夜写出一份报告。
现在,Deep Research Agent可以在十几分钟内完成这个过程——而且信息覆盖更全、来源追溯更清晰、结论更有支撑。
这对私募、券商、资管机构来说,意味着效率提升10倍以上。
咨询服务:用AI武装「知识工人」
咨询行业的本质是知识的收集、加工和输出。一个咨询项目,往往需要快速了解一个全新行业、做竞品分析、梳理市场格局。
Deep Research Agent能够成为咨询顾问的「超级外脑」:比如可以快速构建行业知识图谱、自动生成竞争格局分析、辅助产出专业报告初稿。
这不是取代咨询师,而是让咨询师把时间花在更有价值的洞察和沟通上。
企业内部:知识管理的新范式
对于大型企业来说,内部知识库往往是一座「金矿」——但大多数时候,这座金矿是沉睡的。
员工很难高效地从海量内部文档中提取所需信息。
Deep Research Agent可以与企业知识库结合,实现内部政策、流程的智能问答,跨部门信息的自动整合,以及基于企业数据的深度分析报告。
这,就是企业数字化转型的最后一公里。
开箱即用
最关键的是,百度千帆将Deep Research以开发平台能力的形式开放。
这意味着,企业无需进行复杂的二次开发,即可将这一强大的深度研究能力,直接无缝复用到各类垂直业务场景中。无论是医疗领域的学术文献综述、法律领域的案例检索分析,还是市场营销领域的竞品监测,千帆深度研究Agent都能「即刻上岗」,成为懂业务的专业研究专家。
这个广阔的市场,释放的经济价值会是惊人的。
写在最后
2026年,AI已经不满足于「聊天」,它要开始「做研究」了。
当AI能够自主完成从问题理解、信息检索、深度分析到报告生成的全流程,当它产出的研究报告在专业评测中超越了人类精心设计的标准——
我们是否应该重新思考: 研究的本质是什么?人类的价值在哪里?
度千帆深度研究Agent登顶DeepResearch Bench,这不只是一次排名的胜利,更是生产力工具的质变。
对于每一个还在用土方法做研究的专业人士来说,是时候换个“研究搭子”了。
同时,百度已将这一能力通过千帆平台开放给所有企业和开发者。在这场关于「思考深度」的竞赛中,百度已经率先交卷,真正的较量才刚刚开始。
彩蛋
就在今天(2月5日),百度放出一个大消息: 启动50亿美元股票回购计划,同时宣布公司成立26年来首次派发股息。
50亿美元,折合人民币超过360亿。
这不是喊口号,这是真金白银的自我押注。
当一家公司愿意拿出这么大一笔钱回购自己的股票,它传递的信号再明确不过:
我们对自己的技术护城河与未来增长,拥有绝对的信心。
而这份信心背后,正是文心大模型、昆仑芯、百度智能云智能基础设施,再到登顶的千帆深度研究Agent——这一整套AI全栈体系。
过去一年,百度港股涨了近50%。
当技术变现的飞轮与资本价值的回归同时启动,百度的AI价值重估正拉开序幕。
秒追ASI





京公网安备 11011402013531号