当前位置: 首页 » 资讯 » 新科技 » 正文

“最炫Agent风”正刮,谁能成为御风者?

IP属地 中国·北京 编辑:郑佳 数字力场 时间:2025-08-19 11:55:54
二十多年前,Windows把DOS从命令行变成图标;十多年前,iOS/Android把键盘变成触控;而在今天,Agent又带来了新人机交互方式与任务执行模式。

文 | 数字力场 佘宗明

PC互联网时代的技术主要呈现界面是Web(网页),移动互联网时代的是App(客户端),那AI时代的呢?

比尔盖茨两年前的预言,就给出了答案:AI Agent将是AI最大的赛道,Agent(智能体)不仅将改变人们与计算机的互动方式,还将颠覆软件行业,引发自键入命令到点击图标以来计算机领域最大的革命。

如果说彼时他的这番断言还有些超前,那如今AI Agent时代已来渐成共识的现实,就是跟他打了个响指。

3个月前,微软CEO纳德拉就在微软2025年Build大会上表示:我们已经进入了AI Agent时代,正在见证AI系统如何以全新方式帮助我们解决问题。

有意思的是,当时还跟纳德拉进行了连线的马斯克,旗下AI公司xAI前不久还准备筹建名字内涵微软(Microsoft)的子公司巨硬(MacroHard),定位于打造AI Agent生态。

在硅谷掀起最炫Agent风之际,大洋彼岸的中国科技企业也正以前瞻的技术布局与独特的技术路径,在这场决定未来若干年AI应用生态格局的赛道上积极卡位,努力将身位从追赶者变为领跑者。

01

回顾现代技术演进史,技术发展总是遵循着技术突破-产业聚焦-场景落地的路径,AI也不例外。

2023年初,ChatGPT出圈揭开了AI大模型军备竞赛的序幕,两年多过去了,在Agent元年说法的掩映下,全球科技巨头竞争焦点正从大模型参数转向Agent。

原因很简单:随着大模型参数规模扩大带来的边际效益递减,如何让AI从被动响应工具变成主动规划执行者,已成行业新命题。而Agent就是AI从感知智能迈向认知智能的关键载体,也是连接大模型技术与真实场景的核心桥梁。

作为能自主理解任务、规划步骤、调用工具的AI应用形态,Agent可以让AI不再是孤立的技术模块,而是能深度嵌入企业运营系统的生产力单元,解决传统AI应用场景碎片化、投入产出比低等问题,推动AI技术在产业侧的应用落地。

在硅谷,OpenAI在GPT-4之后,迅速推出GPT-4o Agent,试图通过连接代码解释器、网页浏览器等工具,打破大模型只能对话不能行动的局限;微软则将Copilot深度集成于Windows系统与Office全家桶,提出Agent for Everyone战略;谷歌则押注多智能体协作,发布了Gemini Agent Suite。

▲市面上的大多数Agent都存在诸多能力的不足。

理论上讲,Agent应该像拥有超能力的AI管家,接到任务后会先画思维导图(规划),再检查步骤对不对(验证),然后有条不紊地执行。它长着数字眼睛,能认路避障(环境感知),带着AI大脑,能权衡利弊(自主决策),揣着工具百宝箱,能订票叫车(工具调用),还能有始有终(完成任务闭环)。

可太多Agent不是视障就是智障,可用性、稳定性都不如人意。这就导致,企业将核心业务、重要任务交给Agent处理的意愿不足。

诸如此类的痛点,对应的其实是行业的机会窗口。在Agent竞速进入深水区的背景下,谁能率先解决可用性、稳定性、资源整合等问题,谁就能在Agent时代建立起技术与生态的双重壁垒,掌握定义行业标准的主动权。而GenFlow2.0的解决痛点导向,就来得很明晰。

03

跟时下那些只能跑在网页或客户端上,还得有邀请码或内测资格才能用的Agent有别,百度文库GenFlow2.0有两个典型特征:一是全端通用;二是现货可用。

目前它已同步上线百度文库网页端、百度文库APP,用户无需排队等待,就能开箱即用。

我在移动端试用时,发现它还有个很人性化的地方将传统瀑布流任务展示改为并列式进度可视化,我下达指令后,能直观看到每个Agent的分工(如A Agent负责数据搜索、B Agent负责PPT生成)。

我体验完后的内心os是:百度该给产品经理加鸡腿了。比起滚动条没完没了地下拉,这样操作才更切合普通用户日常习惯吧?

值得注意的是,全球首个全端通用Agent并非GenFlow2.0的唯一优点它直接来了几个行业首发,包括并行模式、记忆模式和全程可干预模式。

▲FenFlow2.0离不开百度AI全栈布局的支撑,又跟百度其他AI产品形成了联动。

在外部生态上,GenFlow2.0兼容MCP协议,荣耀 MagicOS 已原生接入,用户可在手机负一屏一键调用其能力,实现手机端生成PPT平板端编辑电脑端演示的全场景流转;WPS、钉钉、飞书也在灰度测试。

MCP协议的开放性,让 GenFlow2.0 能像乐高积木那样被嵌入任何应用,让其多重能力不再局限于单一应用,而是渗透到用户的生活与工作全场景中。

从全栈布局看,百度的全栈AI能力为GenFlow2.0提供了底部支撑。

从芯片层的昆仑芯(能提供算力支持),到框架层的飞桨(保障多Agent调度效率),再到模型层的文心大模型(有混合专家模型架构、有多模态理解能力),百度是全球少数实现AI全栈自研的企业。全栈技术沉淀,托起了端到端优化的闭环。

05

历史不会重复,但总会押韵。二十多年前,Windows把DOS从命令行变成图标;十多年前,iOS/Android把键盘变成触控;而在今天,Agent又带来了新人机交互方式与任务执行模式。

接下来,谁能用兼具可用性、稳定性的Agent产品更好地解决用户需求、占领用户心智,谁就能拿到下个十年的门票。

而今,GenFlow2.0就有了Android昔日的模样:Android早些年就把硬件、应用、服务统一在 Linux 内核之上,形成了深厚生态壁垒,GenFlow2.0现在则是把算力、模型、数据、Agent、人统一在自然语言这个最朴素接口之上。

对用户而言,当办成很多任务只用一句语音而非复杂操作,那AI的实用价值也就能得到最大化发掘。这里的实用性,本是立足于对用户需求的深刻洞悉,最终会落脚于对用户体验的深层革新。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。