图片由作者拍摄于2025年世界人工智能大会期间
近期,阿里、字节、腾讯、美团等大厂纷纷发力AI智能体(Agent),加速推进生成式AI应用的商业落地。
9月2日,阿里通义实验室宣布推出专注于多智能体开发的新一代智能体开发框架——AgentScope 1.0,核心目标是解决智能体在构建、运行和管理中的难题,提供一套覆盖“开发、部署、监控”全生命周期的生产级解决方案,让智能体应用的开发更简单、运行更安全、监控更透明。
同日,腾讯优图实验室宣布智能体框架Youtu-Agent正式开源;字节旗下Agent平台“扣子空间”则上架到苹果App Store应用商店和安卓商店平台,正式让字节Agent产品独立推向C端客户。
而美团于9月1日发布并开源大模型LongCat-Flash-Chat,总参数量达5600亿,在仅激活少量参数的前提下,具备明显更快的推理速度,更适合于耗时较长的复杂智能体应用。在Agentic Tool Use评测基准上,LongCat-Flash-Chat性能超过了DeepSeek-V3.1、GPT-4.1等模型。
图片来源于美团技术团队公众号
事实上,这些大厂“卷”智能体产品背后,主要在于智能体产品的商业化逐渐清晰,Agent多步推理促进token用量爆发式增长,云和算力需求不断提升,收入已初见成果。Agent智能体技术正在为AI产业带来新的商机。
通用智能体公司Manus对笔者表示,Manus从今年3月上线至今,公司年化收入(RRR)为9000万美元(约合人民币6.46亿元),即将达到1亿美元。
对于AI智能体发展,F5亚太区首席技术官莫汉·维洛(Mohan Veloo)近期对笔者表示,未来一到两年,所有App应用产品都会转变成AI应用,“所以我们需要保护的不仅是现在的应用,更是未来以AI为基础的应用”。
一年内BAT大厂云资本开支超3200亿元,智能体tokens贡献显著
近期,阿里、腾讯、百度等互联网大厂相继发布二季度财报业绩,AI相关收入和资本开支已尽数公布,BAT三家二季度合计资本开支超过615亿元,比去年同期提升168%左右。
其中,阿里集团宣布,第二季度阿里云业务收入333.98亿元,同比提升26%,增速创3年新高;资本开支386.76亿元,同比提升220%,环比提升57%。
阿里CEO吴泳铭表示,过去四个季度,公司在AI基础设施和AI产品研发方面累计投入超过1000亿元。同时,针对AI芯片政策与供应变化,公司已制定备用方案。无论行业出现何种变数,公司都将按计划推进3800亿元人民币的既定资本支出投资。
而腾讯公布2025年二季度财报则显示,CSIG部门的金融科技和商务服务(含云业务)收入555.36亿元,同比增长10%;单季度资本开支191亿元,同比增长119%;而百度二季度云业务收入100亿元,单季度资本开支38亿元,同比提升79%。
据知名投行杰富瑞(Jefferies)8月31日发布的报告显示,过去12个月内,中国四大云服务提供商(阿里云、字节火山引擎、腾讯云、百度智能云)资本支出约为450亿美元,而包括微软、meta等美国大厂云厂商的这一数据为2910亿美元,仅为美国同行的15%,差距较大。
然而,报告也指出,中国也在加速赶超美国AI算力投资。自2023年第四季度以来,中国的资本支出每季度都在快速增长,在2025年第二季度增长了3倍之多。同时,自2024年第四季度起,中国云服务商资本支出占收入的比例已超过美国同行。
海外科技大厂算力并未后退。其中,微软二季度资本支出242亿美元,同比增长27%;meta 2025年全年资本支出的下限提升至660亿美元;谷歌将2025年资本开支从750亿美元提高至850亿美元。
上述大量算力投资背后,得益于市场需求,大量企业都在部署AI推理模型、AI智能体应用,tokens输出量指数级增长。在此之前,行业人士曾透露,Manus单次任务token消耗量达10万量级,单次任务成本约2美元。
图片由作者拍摄自AICon全球人工智能开发与应用大会期间
据F5发布的《2025年应用战略现状》(SOAS)报告显示,全球已有96%的企业正在部署AI模型。其中,91%的受访者表示会利用Web应用与API保护(WAAP)来保障AI与机器学习(ML)模型的安全。
从早期ChatGPT问世开始,AI就已经能实现聊天对话、答疑解惑、撰写文档、生成图像等功能,微软推出的Copilot也是这一阶段的重要成果,但这些都只是 AI 发展历程中的阶段性突破。而在过去半年时间里,AI的价值实现了更大的跃升,借助Agent智能体,AI得以在特定环境中具备环境感知、动态决策、行为执行、工具调用等核心能力,这也加速生成式AI技术落地应用进程。
“AI智能体的一个核心特点,在于以动态策略驱动实现安全防护,从而确保智能体在相互对话过程中始终得到可靠保障。我们已经认识到,智能体在工作时需要实时作出决策,同时还可能需要同步进行多个流程和服务。因此,我们也把AI网关融入到技术产品之中,可以帮助智能体顺畅运行。”维洛称。
维洛对笔者表示,随着大语言模型转向推理、更长的上下文等,让安全防护变得更加重要。基于全新应用交付与安全平台(ADSP),F5推出了AI网关产品,可以在不同形态的基础架构上进行部署,让大量智能体应用得到更好的安全保护。同时,平台可无缝运行于本地数据中心的高性能硬件、虚拟化与混合环境中的下一代软件以及云原生环境的SaaS方案,实现跨环境一体化运维与安全防护,并为用户带来更多应用价值。
对于中国市场,F5北亚区区域副总裁及解决方案资深架构咨询师张振伦表示,F5帮助中国企业打造高可用弹性基础架构,通过GPU资源动态调度,F5帮助中国企业实现用户访问体验提升,降本增效,以及帮助中国企业确保AI训练,RAG构建及AI推理过程中的高速稳定且安全的数据访问与传输等,“我们希望通过F5应用交付与安全平台的应用,帮助中国企业在 AI 旅程的每一个关键节点上都得到精准支撑”。
IDC最新报告显示,中国企业AI智能体(Agent)应用虽处于追赶全球阶段(34%受访企业开展测试验证,30%进入“较大投入+采购培训”阶段),但在技术成熟度、成本优化与行业接受度的三重拐点叠加下,已突破实验室场景,在金融、制造、零售等流程标准化程度高的领域形成规模化落地。
IDC预测,到2028年,中国企业级Agent应用市场规模预计将超过270亿美元。
物理AI落地亟待解决安全防护问题
“下一波浪潮是物理AI。”如同押注OpenAI一样,英伟达CEO黄仁勋正在押注未来的通用AI技术,即具身智能和人形机器人赛道。
今年8月25日,英伟达宣布推出功能强大的新型机器人超级电脑NVIDIA Jetson AGX Thor开发套件和生产模块,旨在为制造、物流、建筑、医疗保健等领域的下一代通用和人形机器人(Humanoid Robots)提供动力。
“这是物理AI的一次巨大飞跃。”英伟达表示,Jetson AGX Thor由英伟达Blackwell GPU提供支持,CPU部分基于Arm Neoverse V3AE构建,并配备128GB内存,可提供高达2070 FP4 teraflops的AI计算能力,轻松运行最新AI模型。与前代产品Jetson Orin相比,Jetson Thor可提供高达7.5倍的 AI 计算能力和3.5倍的能源效率,能够实现实时推理,这对于高性能物理AI应用至关重要。
然而,相对于AI大模型来说,具身智能和人形机器人安全防护变得更加重要。
北京交通大学信息管理理论与技术国际研究中心教授张向宏对笔者表示,具身智能和人形机器人的数据有两类,现在都是世界性的难题,一种是非线性的公域数据,有限的数据和模拟仿真不能满足无限的场景应用;另一种是缺少泛化性数据,以及Agent智能体在机器人当中的知识能力。
张向宏指出,机器人被人一脚踢倒或绊倒爬不起来,需要人帮忙,而这在万千的场景当中的一个动作(数据),是一个世界级的难题,它想要爬起来,需要大量比如力觉、嗅觉等数据,而且从底层数据采集后还要进行清洗和处理,根本不知道该怎么利用这些数据,这是非常困难的。最关键的是,数据还不够多。
张向宏强调,人形机器人未来一定是通用型产品,因此机器人需要加入更多Agent智能体技术,这是发展趋势之一。
蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算董事长韦韬此前对笔者表示,具身智能和机器人的安全问题十分严峻,因为这意味着整个网络空间跟物理空间彻底融合,“以前撑死了把网线拔掉,这没什么大不了,但今天机器人真的可以去按核按钮了,真的可以放出病毒了,所以呼吁整个安全体系需要提前做好准备,它的安全保障、复杂度和风险度已经是一个彻底的质变。”
“我们认为,下面一定是有很多新的技术突破,今天只是(具身智能)行业的第一波兴起,我们看到当中的巨大突破潜力。”韦韬强调。
维洛表示,具身智能和各类机器人肯定需要应用和安全支持,同时具身智能机器人是边缘AI设备,需要控制它的延时性。F5提供融合平台,不仅可以保证应用安全,还能够保证快速交付应用。
据统计,2024年,中国人形机器人市场预估销售量达2400台(指的是具有双臂、头部和双腿形态的机器人),2025年人形机器人市场销量将超万台;2025年中国具身智能市场规模约52.95亿元,预计到2030年,中国具身智能市场规模将达到1037.52亿元,占全球44.6%。
彭博认为,今年全球生产的人形机器人中,预计一半以上将来自中国。
祥峰投资管理合伙人夏志进对笔者表示,目前国内机器人和具身智能行业处于“过热”状态,仍未“降温”。
花旗银行发布报告预测,到2050年,全球具身智能和人形机器人市场规模将达7万亿美元(约合人民币50万亿元)。(本文首发于钛媒体App,作者|林志佳,编辑|盖虹达)