
![]()
“Agent Infra 之战,被火山推上了新高度。”
作者丨林觉民
编辑丨Kash
云厂商突围,今天已迫在眉睫。
在市场厮杀多年,云市场早已被“钳”得窒息——难以遏止的恶性价格战、难以标品化的项目、难以规模化的高投入商业模式,就像一个泥潭,让厂商们深陷其中。
而被市场“炒了又热,热了又炒”的大模型,会是云厂商冲破泥潭的突破口吗?许多人如此相信,但如何突围,答案还并不明朗。
12 月 18、19 日,字节火山引擎召开了 2025 年的冬季 Force 大会,以豆包大模型 1.8、视频生成模型 Seedance 1.5 pro 等新进展,决心在行业的坚壁上砸开一条“渠”,把 AI 的“活水”引进行业。
可以说,Agent 是今天 AI 实现突破的“超级共识”,但怎么发展 Agent,却仍然是厂商们众说纷纭的“多元叙事”。
Agent Infra 平台——“AgentKit”,则是火山为了这场“大考”给出的答案。
今天,Agent 开发者平台不少,火山做 AgentKit 背后的逻辑是什么?这一切,或许早就可以从火山引擎的发展史中,找到暗藏的草蛇灰线。
01
火山 MaaS 登顶 No.1,主要是抓住了 AI 红利
2025 年,哪家云厂商 MaaS 走得最靠前?答案非火山引擎莫属。
IDC 十月的报告《中国大模型公有云服务市场分析2025H1》显示,今年上半年,中国公有云上大模型调用量达 536.7 万亿 Tokens。其中,火山引擎的调用量全国第一,市场份额 49.2%,独占半壁江山。
而五年前,早期的火山引擎被夹在一众传统云大厂中间,在市场上举步艰难。
火山引擎,一直等待着一个机会。2023 年,大模型带来了新市场和新机会。看到超车窗口,其他竞争者一拥而上,在百模大战中做了“分母”;而火山则不同,作为中国第一家制定了 MaaS 战略的云厂,凭借着扎实的技术基础和稳定的执行,在智驾领域弯道超车,吃下了不少主流厂商的 AI Infra 需求。
几年前,仍在 IaaS、PaaS、SaaS 架构下挣扎的云厂商中间,就已经有不少人开始发现,原有的市场模式正在失效。而新的 MaaS 架构以模型为核心进行设计,让云向着 AI 原生的方向又走出了一步。
从“传统云”到“AI 云”的范式转移,火山引擎走得更靠前,也就在 MaaS 的赛道上获利更早——用人话说,就是把过去传统云厂“卖算力”的资源生意,变成了今天依托优质模型“卖 Tokens”的服务生意。
为什么卖 Tokens 比卖算力更先进?火山引擎想明白得更早:调用量不仅仅是销售数据,更是大模型自身进化的重要催化剂。
大模型的调用越多,用户使用和反馈就越多,大模型就能更快地进行迭代和进化,进而收获更多的调用——这就是大模型的“数据飞轮”。
理清了这一点,火山才敢于大幅降低价格,把模型开放给开发者调用,让豆包从以“分”计价变成以“厘”计价,降幅达到 99.3%。
不少云厂咬紧了牙根,火山却显得举重若轻,原因正是买算力、租 GPU 和 CPU,能不能赚到钱,终归是一城一池的得失;而火山在每一次 AI 的热潮中都登上一级台阶,促使业务进一步扩张。
今年年初,DeepSeek 在国内搅动乾坤,火山就承接了绝大部分Tokens 调用,抓住了新的 MaaS 成长机会。
如果说,AI 云的架构可以被分成三层:以模型为核心的 MaaS,协助 Agent 开发的中间件,与帮助 Agent 在实际场景中大展拳脚的 Agent 运营。
![]()
图源:火山引擎 2025 冬季 Force大会
用人话来说:通过 MaaS 架构把模型能力开放给外部,通过调取 Tokens 的方式,实现商业营收,并同时以数据反馈带动模型的成长,今天的豆包大模型 1.8、Seedance 1.5 都属于这一层;
然而模型的能力是未经过包装和场景适配的,企业要通过 Agent 来实际解决问题,而又缺乏相关的开发经验和工具,这就需要 Agent 开发工具为企业完成赋能,AgentKit 就是火山为 Agent 开发设计的一柄利器;
最后,当 Agent 被制作出来,实际应用当中,企业中无数的 Agent 又需要被完善纳管,Agent 运营的重要性也就逐渐凸显出来,火山今年推出的 HiAgent 则负责这一层的工作。
到今天,火山引擎似乎已经找到了正确的方向。建立好 MaaS 模式,火山的下一步,便开始向 Agent 开发平台“AgentKit”进军。
02
Agent 创新大潮下, AgentKit 是顺势而为
如果问,从 2023 年 ChatGPT 横空出世,到 2025 年冬季竞争格局初定,市场上最大的认知升级是什么?
不少人或许会有一个答案:创业者入局自研大模型,挣钱相当困难;而 Agent 做起来更轻量,距离用户更近,才是真正能够赚到钱的好门路。
简单来讲,Agent 就是 PC 时代的门户网站,移动互联网时代的 App,是今天组成了 AI 生态的“空气和水”,或许将是下一代最炙手可热的商业标的之一。
2025 年,Agent 大潮迅猛,很多“一人公司”不仅拿到了融资,甚至已经在亲子、心理、办公等领域赚到了钱;而不少大厂出来的创业者,从钉钉的前 CEO 叶军,到抖音的早期干将卷卷,再到百度的“小度之父”景鲲等等,无数人才带着热钱,一起涌入 AI Agent 赛道。
作为云赛道难能可贵的活水,这些创业者自然是云厂商梦寐以求的“香饽饽”,而要服务好他们,仅凭传统云服务“卖卡卖算力”的服务还远远不够。
今天,云厂商的服务模式正受到巨大的挑战。过去,人们常把提供基础服务的厂商——尤其云厂商——的商业模式,类比成给淘金工人“卖水卖铲子”。但今天,“水”和“铲子”早已不是稀缺资源,要把服务卖到 Agent 创业者心坎里,就必须提供更贴心务实的服务,提供更高效好用的工具。
“新的时代我们需要新的技术架构,我们希望 Agent 能够自行通过模型,完成思考和规划,”2025 冬季 Force 大会上,火山引擎总裁谭待讲道,“这就需要 Agent 能够自动的调用工具,自动去使用各种云资源和数据库,因此我们需要一个全新的面向 Agent 来设计的新架构——这个技术架构就是火山引擎一直在提倡的 AI 云原生架构。”
通过 MaaS 架构,把“卖算力”变成“卖 Tokens”只是第一步。火山跟进的第二步,是通过 Agent 开发平台,把 Tokens 组装成 Agent,并提供包含中间件、SDK 和工具在内的一系列支持,来让 Agent 能安全高效的运作,并且可以与同体系内成百上千个其他 Agent 协作,适配现有的工作流和系统。
一句话说:谁能把 Agent 的 Infra 做得更好,谁就能留住 Agent 开发者,并且在他们成长起来之后,长期可持续地把云服务提供出去。
而在市场上,却仍然缺乏专为 Agent 规模化运行而设计的基础设施。瞄准这块重要的市场真空,火山引擎将自家的 AgentKit 全面升级,作为企业 Agent 开发平台正式对外推出,让企业能够更高效便捷地把 Agent 落地到生产环节。
这是火山的重大机遇。豆包基础模型能力够强,自身客户经验更足,更了解开发者和创业者的实际需求,能把工具做到人心里去,火山手里的牌已经相当齐整。
在 Agent 的大潮下,花心思做好 AgentKit,比起跟风追涨,更像是火山引擎的顺势而为。
03
各家都在做工具,火山的 AgentKit 到底牛在哪?
先说结论:
作为面向企业级 Agent 开发设计的开发平台,AgentKit 可以覆盖 Agent 应用落地的全生命周期,并且实际解决企业 Agent 落地过程中真正的挑战。
简单来说,和市面上不少其他平台相比,AgentKit 不是“管杀不管埋”的玩具,而是要让企业能更简单地做出 Agent,并且做了就能用上,能安全,能提效,能赚钱。
2025 冬季 Force 大会上,火山引擎总裁谭待直言:“根据我们的调研、其实真正能开发好好的Agent的企业并不是非常多,而在这里面能够把Agent运营的好、能让智能体被大规模使用的企业就更少了。”
对有一定 AI 能力的企业来说,做一个 Demo 级的 Agent 不难;但要让 Agent 实际落地并且生产可用,中间或许要经历数个月的工程化改造,并且旧有的平台鲜少有标准化的开发框架和部署流程,就让这个过程更加的困难。
即使完成了 Demo 的创建,缺乏合适的鉴权、观测和评估体系,Agent 也很难对抗与之而来的风险,距离部署到生产环境实际可用,就又多了一大段距离。
而 AgentKit 的目标,就是让这些 Agent 都能顺利从“花瓶”蜕变成“道具”,实际为企业降本增效。
Agent Infra 的路径,火山引擎在海外也有“同路人”。AWS 自建了 AgentCore 平台,微软也在十月做了新的 AI Agent SDK,除此之外 OpenAI、谷歌都有相应的布局。
而包括上面提到的 AWS、微软等公司在内,不少云厂做 Agent Infra,提供的是一个个封装成 SDK 的能力,本质上还是“卖水卖铲子”;
而 AgentKit 背靠着更强的 AI 云原生能力,做的是一个完整的、开箱即用的云原生 Agent Infra——这也让火山引擎在国内云厂的竞争中脱颖而出。
为什么火山能把 AgentKit 做出来?除了云原生的技术硬实力,火山对企业用户的洞察够深,足够了解用户的痛点,才能针对性地做出调整。而用户要做好、用好 Agent,则不得不面临着三座“大山”。
首先,安全问题,是 Agent 实际开发和使用中难以逾越的第一座大山。
对于 Agent 来说,它必须是一个能够主动执行任务的智能体,代表用户去调用服务、访问资源——那么,Agent 身份管理的问题也接踵而来。
一般来说,用户使用 Agent,就必须为 Agent 设定权限。权限低了,Agent 没法干活;权限高了,Agent 又可能越界;加之,Agent 还必须考虑到黑客攻击的风险,如果原本不属于用户意图的请求被混入 Agent 的执行过程,手握“大权”的 Agent 就可能成为让“千里之堤”溃塌的“蚁穴”。
在日常的工作流使用当中,通常是数十,乃至上百个 Agent 同时运行,并且和工具反复互相调用,链路长且复杂,很多时候还会通过第三方的 API 穿越不同的“信任域”,凭证管理复杂不说,还面临跨域和跨服务的信任问题。
如果你的私人秘书,手中掌握你和公司的大量关键事务,却没法说清“自己在何时做了什么”,任谁都会坐立不安,没法放心——这就是 Agent 身份缺失带来的巨大安全风险和合规隐患。
而火山引擎 AgentKit 的 Identity(身份)模块,就是为了解决这些问题而设计的。
AgentKit 为企业的 Agent 们设计了一套清晰、可审计的身份系统,不仅明确了其行为的边界,更将它代表谁执行任务、调用工具管理得明明白白。让 Agent 安全可控,才是一切 AI 实践的起点。
除此以外,在 AgentKit 的 Gateway(网关)模块上,火山为 Agent 设置了统一的入口,无论是人、系统还是 Agent,访问路径、鉴权和策略都在这里统一收敛。
就如同一座金库,只有一个入口,就降低了外界威胁入侵的风险。
身份模块是 Agent 的“身份证”,标注它的权限和职责;网关模块是一个严格把守的入口;而 Guardrails(围栏)模块,则是 AgentKit 为企业提供的安全护栏,让 Agent 把规则、合规和边界内建进自己的运行过程,为 Agent 安全又添一层保障。
三箭齐发,AgentKit 让企业的 Agent 使用放宽了不少心。
以某汽车厂商为例,在该厂的车载终端 Agent 上,每天都会遭遇海量的提示词注入攻击与恶意数据投毒。而火山的 AgentKit 为这间车厂提供了一套全方位的安全、身份和授权管理体系,从开发到负载、工具调用的整体链路把控安全问题,提供实施风险扫描和安全加固、围栏的能力,把企业 Agent 的安全隐患降到了最小。
解决了安全问题,让企业级 Agent 难以快速落地的另一座大山,是原有数据系统的改造难题。
发展至今,不少企业其实已经有了一套行之有效的业务管理系统。而要用 AI 对原有的系统进行改造,并不总是“喜上加喜”,而是要把原有系统几乎推倒重来的“改头换面”。大量代码面临重构,数据流、交互等模块都需改造,企业成本高、风险大,引入 AI 的热情自然就小了不少。
如果只是耗费人力物力,或许对企业来说,或许还不是阻止他们 AI 改造的“死结”——企业原先积累在系统中的知识和数据,通常体量大、欠梳理、质量差,业务知识更隐性,这也让 Agent 更加难以理解企业的 Knowhow,进而实际为生产力提供帮助。
到了 AgentKit 这里,其自带的 Memory(记忆库)模块,则给企业带来了 Agent 长期、可管理、可治理的上下文记忆,通过帮助他们重构一套可更易部署、行之有效的数据体系。
在医疗行业,药店的许可证件体系复杂,文件格式也从 PDF 到压缩文件不一而足,有时连运营专员也容易犯错,而 AgentKit 则可以帮助他们更好地处理这些事务性工作。
管理文件,重要的是准确——而准确的基础,则是一套能处理复杂知识体系的知识图谱。AgentKit 可以提供更细致的业务知识梳理和向量数据库检索方案,落地一套医药门店资质管理 Agent 知识库,来帮助企业快速建店,或打通线上外卖业务,处理好资质查询、审核、经营许可校验等繁杂且精细的事务。
处理好安全和系统改造的问题,Agent 想做好,还必须得跨过 AI 的“黑盒困境”和评估缺失这最后一座“大山”。
AI 推理过程不可解释,就像一个密不透风的“黑盒”,常常被称为 Transformer 架构大模型的“原罪”——多 Agent 协作、去幻觉、事实性验证等领域面临的困难,大多可以归咎于此。
不仅推理不可解释,Agent 的评估也很难量化。今天,不仅市面上面向专业 Agent 的评估体系仍然缺失,实验室的评估环境与 Agent 实际落地的场景也有云泥之别,测试用例构造困难,工具调用的评估也并不简单。
这一切,如果聘请人工评估、调整,企业则面临着高昂的成本——一套可观测、可评估、支持更优质开发环境的 Agent 开发平台,便承担了企业用户太多的期待。
千呼万唤始出来,AgentKit 则把这些功能,都集成到了自己的平台上面。
针对大模型不可解释的“原罪”,AgentKit 设计了一套 Observation(观测)能力模块,让 Agent 的每一次决策、每一步调用,都可被用户以完整链路追溯,把“黑盒”变成透明的“白盒”。
AgentKit 同样为 Agent 增设了一套 evaluation(评测)体系,不用感觉评价 Agent 好不好用,而是用量化的指标、数据、回放持续评估,让厂商能让自家的 Agent 取长补短。
时至今日,AgentKit-evaluation 已经累计对一万多个 Agent 进行了 20 万次的评估,在这样的积累下,火山拣选出了超过 50 个标准化的官方评测器,帮助企业快速地完成冷启,完成智能体能力的量化评估。
而为了让 Agent 能在更贴近实际生产场景中得以开发,AgentKit 还内置了 Runtime(运行时)和 Sandbox Tool(沙箱工具)两个模块,前者让 Agent 能够脱离脚本和 Demo,直接跑在稳定、弹性、可隔离的生产环境当中,后者则让可能带来系统风险、访问敏感数据、执行不可信代码的调用,被限制在一个封闭的环境当中,保证系统在 Agent 开发时的安全性和高效性。
这些功能模块,在金融场景中给企业带来了不小的提效。
在某券商金融大模型持续迭代的过程中,SWE 镜像储存文件大、共存版本多,导致存储需求增长,成本也居高不下,AgentKit 为企业提供了 SWE Bench 的自动评测集功能,把存储、维护的显性成本和隐性成本压低了不少。
而在金融大模型的强化学习优化阶段,AgentKit 的沙箱工具,则支持高效的任务调度,批量毫秒级相应,让训练效率突飞猛进,有效地缩短了实验的周期。
就在今年的冬季 Force 大会上,火山引擎展示了使用 AgentKit 制作的“智能会议助手”,内置“会前智能推荐Agent”“智能签到Agent”“智能总结Agent”三个智能体。相比传统开发模式,基于火山 AgentKit 开发的“智能会议助手”代码量减少了96%。
04
结语
说回最初的逻辑:云厂商在过去面临的最大困境,是极致高压的存量市场中,鲜有供厂商出头的机会,行业的僵化也就不可避免。
而大模型的机会来了,不少云厂商却依着自己的惯性,走原先的老路,就又不可避免地落入到旧有竞争格局的窠臼当中。
属于云厂商的 AI 新路怎么走?雷峰网总结了一下:
传统云要突围,关键点在 AI;
AI 云要突破,就必须从简单卖算力,进化到建设以 MaaS 为中心的模型和商业飞轮;
而要做好 MaaS,让更多企业和开发者入驻,核心则是做好 AI Infra 的建设,帮助更多专业用户能做出专业 Agent,实际完成降本增效、赚到真金白银,进而让更多人用上 AI 云,反哺云厂商的商业。
火山本次发布的 AgentKit,意义就可见一斑。
下半年,在同时期公布的日均调用量上,火山引擎的数据已经接近谷歌;而今年冬季 Force 大会上,火山引擎公布的日均 50 万亿 Tokens 调用量,国际第三已属第一梯队成绩,仅次于OpenAI和Google,国内则以头名身份傲视群雄。
要在领先的地位上待得长久,用户的飞轮则是一切的关键。
正是看到了这一点,火山引擎以 AgentKit 作为矛头,杀向专业级的 Agent 开发赛道,在核心用户群体中做精做深,让人真正用起来,再逐步辐射爱好者和一般用户,一个个地击穿用户圈层,进而实现 AI 云的大发展。
这就是火山引擎的 Agent“阳谋”。





京公网安备 11011402013531号