
![]()
“什么是办公Agent的「硬本领」与「真壁垒」?”
作者丨徐晓飞
编辑丨林觉民
眼下,AI办公智能体正在迎来最热切的期待与审视。
2024年“大模型吞噬软件”论断震惊全球科技圈,让人们不得不正视:传统软件正在被以大模型为核心的新形态所颠覆。
而这一“新形态”最直接的体现便是以“自主决策、任务闭环”为核心的智能体。它推动了生产力工具从“功能堆砌”转向“任务驱动”,把人从繁杂的软件操作中解放出来,打通人与任务间的“最后一公里”。
这场革新中,办公领域因数字化渗透最深、场景最广、离生产力一线最近,成了变革的核心试验场,也承载着人们的热切与审视:智能体在办公场景的“核心价值”是什么?何为“可用”与“好用”的智能体?从“可用”到“好用”的跨越,又需要哪些关键技术与经验支撑?
上周,商汤科技举行了2025产品发布周。重新定义“AI原生办公”——“办公小浣熊3.0”为行业带来了新范本。
01
什么是AI办公的“核心诉求”?
事实上,传统办公模式长期受制于“软件驱动” 的桎梏,因为其底层逻辑是: “人要去适配工具、迁就工具”。
比如,职场人需在多款软件间频繁切换,手动完成数据录入、格式调整、信息同步等重复性工作,工作流被切割成一个个碎片化的操作环节。一个完整的任务往往要跨越多个平台,不仅消耗大量时间成本,也容易因人为操作失误而导致效率损耗。
这种模式下,工具成了“核心”,人反而成了被动的操作者,大量的创造力与决策价值都被繁琐的流程稀释掉了。这也是传统办公场景下长久存在的隐痛。
AI办公智能体正在改变这种现状。
但人们发现,不少产品距离用户期待的“好用” 还有不小差距。有用户曾向雷峰网反馈:“在一些国外技术论坛里,有不少乍一看让人眼前一亮的 Aha moment 产品,但实际体验下来却效果一般。”
02
从“可用”到“好用”,至少要突破三大关卡
人们想要一款“好用”的AI办公智能体,但“丰满的理想”下,现实情况往往很复杂。
互联网公司市场部经理李萌对此感触颇深。她们的市场团队每天要对接五花八门的信息——既有销售端传来的Excel数据,又有活动策划的Word方案,还有客户投诉的聊天截图,甚至是竞品分析的PDF报告。
最头疼的就是做营销复盘时,得把Excel里的数据、微信里的客户反馈、PPT里的活动亮点全凑到一起,光是整理素材就要耗大半天。
“之前用AI帮忙做复盘,文件一杂、信息一乱,它就抓不住重点,要么只罗列数据没结论,要么漏了关键的客户意见,根本达不到直接用的程度。”李萌无奈道。
商汤小浣熊3.0进行市场活动复盘分析
在不少C端用户眼里,以往的AI办公产品同样存在不够好用的现象。
“过去的AI做PPT,总离直接落地差口气——生成的往往只是文字堆砌的初稿,没有清晰的逻辑框架,还缺少适配的图表和配图。”
比如要准备一份新产品宣讲PPT,即便提供了产品数据、客户需求、竞品分析等信息,AI也只是简单罗列内容,既梳理不出层层递进的逻辑,也不会自动将数据转化为直观图表。
最终输出的PPT,还需要用户花大量时间调整结构、优化版式、补充素材,无法直接拿去使用,跨不过“最后一公里”的交付门槛。
类似的情况还有很多。
这时候,“好用”的AI办公“搭子”到底应该是什么样的?
李萌在使用了小浣熊3.0这款办公智能体后,有了自己的答案。
在月度增长复盘场景下,面对李萌团队的困境,小浣熊能读懂深层需求,自动拆解任务,整合 Excel 数据、分析报告等多源资料,直接输出含数据图表、结论明确的复盘报告和完整 PPT,李萌稍作确认即可直接使用,省去繁琐打磨。
商汤小浣熊3.0进行月度增长复盘并完成总结PPT
在PPT交付场景下,小浣熊构建了一套多模态智能体创作引擎,把PPT制作从“帮着排版”直接拉到了“自己能做”的水平。
它能吃透用户零散信息背后的真实需求,规划好完整结构,直接生成PPT——绝非简单文字堆砌,而是已统筹好大纲、版式,还会自动匹配图片、生成图表,最终交付专业且可直接讨论的成品。同时小浣熊3.0还具备类似人的 “记忆” 机制,能记住用户的偏好和风格,让后续的输出更贴合用户个人习惯。
商汤小浣能3.0进行PPT生成和制作
而针对用户经常出差、路上使用电脑不便的场景,商汤小浣熊3.0还将在近期推出移动端APP,让用户在手机上也能延续电脑端的工作流程,变成一个永远在线的口袋助理。
而这种从听懂“指令”到理解“任务”,从给个“草稿”到交付“成果”,从困在“单点”到融入“全域”工作流,正是近期商汤小浣熊从2.0升级到3.0版本后实现的“三大能力跃迁”。
而这背后并非单纯的技术迭代,也包含了对办公本质的深度思考。
商汤科技小浣熊负责人贾安亚告诉雷峰网,在研发之初,团队就在思考:“什么是大模型时代的 AI 办公?我们到底想做一个什么样的 AI?”
“我们的答案非常明确:第一,我们不做冷冰冰的工具,而是要做能帮你进入“工作心流”的伙伴。第二,我们不做博眼球的demo,而是扎根用户的真实场景,解决真问题。”
正是基于这一思考,过去两年间,小浣熊从1.0到3.0一路走来,不断升级。
03
什么才是AI办公智能体的“真壁垒”?
雷峰网对比发现,与市面上大部分AI办公智能体相比,小浣熊3.0的优势体现在以下三点:
一是,超强的理解与数据分析能力。最早的小浣熊1.0版本——国内首个数据分析智能体,其擅长的就是做复杂的多模态数据分析,并且得到了不错的市场反馈。小浣熊3.0更支持了百万级数据量处理,及多模态多源数据分析。
![]()
其二,100分的成果交付能力。小浣熊3.0依托商汤日日新Agentic RL(智能体强化学习)技术实现了端到端复杂任务规划与闭环能力。尤其它建立更好的交互反馈与人机协作模式,让所有过程、结果都可编辑,实现了可控输出,让95分的成果升级100分交付。
第三,移动端APP上线后,更补全了最后一块跨平台处理的拼图。让它能更好地实现全流程一站式办公,融入企业工作流。
这其中,小浣熊 3.0依托的商汤日日新Agentic RL是商汤科技在模型底层技术上的重要突破。
“我们去年大部分时间专注于数据分析,在单模态与多模态领域实现突破;今年上半年则聚焦复杂任务,深耕推理、拆解能力及智能体技术,完成了重大突破。”贾安亚透露。
具体来说, Agentic RL解决了三大核心技术挑战:
一是会“一步步琢磨”的长程推理。
面对图片、文字、文档这些杂乱的多类数据,"小浣熊"不再是简单的模式匹配,而是拥有了像“思维链”一样的自主规划能力,能把一个模糊的分析目标(比如“做一份产品销售分析”),拆成“整理数据→提炼关键信息→做图表→验证结论”等几十个清晰步骤,还能一直记住前后逻辑,不跑偏。
二是,每一步都“自我检查”的价值对齐。
不同于在多模态分析的每一步中,无论是提取PPT文件的页面数据,还是编写一段Python分析代码,Agentic RL的Reward系统都会实时评估当前步骤动作的价值。
目前主流的强化学习仅对最终结果进行奖励,而小浣熊引入了细粒度的过程监督——不管是从PPT里提数据,还是写一段分析代码,每做完一步都会实时“打分”,判断这步做得对不对、有没有用。
这使得模型具备了一定的自我反思能力,对于中间步骤出现偏差,它能进行自我修正并重新规划计划,大幅降低了模型的幻觉率。
三是,环境交互与闭环进化。
简单来说,小浣熊在处理任务时,会不断和数据工具互动,根据反馈调整做事方法(比如这次图表做反了,下次就自动修正)。这种机制让模型能够从错误中学习,实现推理能力的端到端的持续进化。
此外,针对PPT生成场景,小浣熊3.0专门研发了多模态智能体创作引擎,通过解耦内容与样式,实现高质量、可直接交付的自主创作。
而小浣熊3.0能做到这些,背后还有着更深层次的壁垒支撑。
贾安亚告诉雷峰网,在AI办公智能体的进化上,单点技术优势难以持久,小浣熊真正的核心优势,是技术层、产品层、落地方案执行层联动的组织化系统工程能力,而这背后是商汤十多年的沉淀。
比如,小浣熊兼具 B、C 两端属性,其中 To B 属性方面,就依托了商汤在 To B 场景十年的深耕与积累,再加上小浣熊自身过去两年间服务 300 多万个人用户与 1000 多家企业用户的实践,有教育版、金融版、政务版等等,沉淀出了一套成熟的To B、To C 系统工程方法论,这一点尤为关键。
因为眼下AI原生办公已经成为生产力基建,它不再是工具的简单叠加,而是以用户核心任务为轴心,彻底重构流程、释放生产力的效率革命。
这种背景下,从单一办公工具升级为支撑企业数字化转型的办公平台,尤其是支撑国产化办公基础设施,扛起服务者、基建者的使命,也成为中国AI企业的重要担当。
以商汤为代表的企业正以行动践行这一方向。
“为积极响应国产化的需求,小浣熊已经实现了从模型到硬件的全链路国产化适配,后续还会陆续推出国产化的AI PC、AI box,适配更多场景。”贾安亚补充道。





京公网安备 11011402013531号