01
增程猜想落地
![]()
数字员工不缺能力,缺的是进公司的资格。
作者|郑玄
每个管理者都想要一个孙悟空当下属。
不是那个大闹天宫、难以管束的齐天大圣,而是西行取经路上的大师兄——唐僧团队里能力最强的员工,降妖除魔的难活累活全包,永远靠谱、随叫随到,还能七十二变应对一切突发状况……
今天,阿里发布了自己的 AI 原生工作平台,由钉钉团队打造。这是阿里宣布成立 ATH 后的第二天,就重磅推出的旗舰企业级产品。
![]()
Alibaba Token Hub成立第二天,阿里巴巴集团CEO吴泳铭出现在“悟空”发布会现场。
将这个产品命名为「悟空」,本身就是一种宣言。
今年上半年,OpenClaw 在技术社区刷屏的方式,和以往任何一个 AI 产品都不太一样。
它不是一个聊天机器人,也不是一个代码补全工具。它是一个能直接操控计算机的 AI——打开浏览器、整理文件、填写表单、发送邮件,从头到尾自己来。龙虾很快从极客圈的玩具,蔓延到泛科技圈、甚至普通人群体,国内大小城市纷纷举办龙虾活动……这是去年 Deepseek 以来,AI 最现象级的产品。
然后,一批人开始尝试把它真正部署到企业里。
这批人里有创业者、有企业 IT 负责人,也包括我们自己——极客公园内部也做过几轮 OpenClaw 落地实验。结论几乎一致:它确实能干活,但没法在公司里干活。
问题不只出在技术稳定性上,尽管他确实能做到一些事情,甚至在某些方面超过了人类员工。但根本的问题在于,OpenClaw 缺少「职场常识」。它不知道哪些文件可以动、哪些系统不能碰;它不理解审批流程意味着什么,也不清楚操作留痕的必要性;它在执行任务时没有任何权限边界意识——即使你给了它一些命令,它依然会在某些时刻莫名其妙的犯错。
![]()
钉钉 CEO 陈航(无招)丨来自:AI 钉钉 2.0 发布会
钉钉 CEO 陈航(无招)在发布会上讲了两个真实案例。一家科技公司的 CEO 把 OpenClaw 装在电脑上之后,在某个 3000 人的群里,陌生人随口问了几句,AI 就把这位 CEO 的 IP 地址、姓名、公司信息全部吐出来了——它不知道什么叫做信息安全,也不知道对方是不是可信的人。另一个则是此前广为流传的故事:meta 的安全总监在测试过程中,200 余封重要邮件被 Agent 批量删除,且无法中止。
这不是小概率事件,这是把一个没有任何企业常识的 AI 放进公司必然会发生的事。归根结底,OpenClaw 代表的是「技术可行」,但企业要的是「业务可用」——这中间有一条巨大的鸿沟,叫做「职场通行机制」。
通往企业级数字员工,龙虾差的不是模型能力,而是一套完整的职场通行机制:权限体系、安全边界、工作流嵌入、操作可审计。
3 月 17 日,钉钉在「AI 钉钉 2.0」发布会上,正面回应了这个问题。
01
悟空是什么:
一个「知道规矩」的硅基员工
3 月 17 日的发布会上,钉钉同步推出了独立 App「悟空」和 AI 钉钉 2.0 版本。这是钉钉成立 11 年来第一次推出独立产品,从定位到底层架构都做了彻底的重新设计。
理解悟空,首先要理解它和 OpenClaw 的本质差异——这不是一个谁的模型更强的问题,而是一个定位问题。
OpenClaw 是技术框架,不预设企业场景,也不内置组织概念。把它部署进企业,就像把一个刚毕业的技术天才直接丢进公司,告诉他「你很厉害,去干活吧」——他可能真的很厉害,但他不知道规矩,不知道汇报给谁,不知道哪些操作需要审批,也不知道自己会不会踩到别人的地界。
无招在发布会上对这个问题有一句概括:「过去是人用钉钉来工作,未来是 AI 用钉钉来工作。和市面上所有的龙虾 Agent 不一样,悟空天然就长在企业组织中,可以在真实的企业环境中安全使用。」这句话的重量,远比听起来要大。
![]()
DingTalk CLI 丨来自:AI 钉钉 2.0 发布会
为了让这句话落地,钉钉做了工程量极大的底层重构:将整个钉钉进行 CLI(命令行界面)化改造,把上千项功能拆解为可被 AI 直接调用的原子化命令——发消息、调数据、触发审批、操作表格,每一个动作都变成 AI 可以精确执行的指令,而不是模拟人类点击图形界面。这是 AI 用好钉钉的基础:GUI 适合人类,但会让 AI 像是在蒙眼靠猜按按钮;而 CLI 是直接给 AI 一本字典,每个词对应一个确定的动作,执行效率和可靠性都大为提升。
钉钉还在这次发布中推出了一个专为 AI 设计的文件系统——RealDoc。这背后有一个被长期忽视的工程问题:Unix 是 1969 年为人类操作设计的,记录「最终结果」,不记录「过程」。但 AI 的工作方式是高频读写、不断试错、随时回滚——它需要一个支持原子级修改(精确到行列单元格)、每秒可保存上千次版本快照的文件系统。RealDoc 解决的是这个问题,同时把 AI 执行过程中产生的判断和决策沉淀为企业知识图谱,让数字员工在使用中持续积累经验。
![]()
数字员工「安全第一」丨来自:AI 钉钉 2.0 发布会
安全层面,悟空的设计了四道防线。
第一道是账号绑定验证——悟空安装时绑定钉钉账号,任何远程调用必须通过同一账号核验,避免陌生人随意唤起获取数据(这正是开篇那个 CEO 信息外泄事件的根源)。
第二道是安全沙箱——Agent 在受限环境中运行,可访问资源和可执行命令都在预设范围内。
第三道是数据隔离——企业可部署专属模型实例,数据不参与公共训练、不外泄。
第四道是技能验证——所有 Skill 须经企业安全审核才能启用,防止网络上流通的恶意第三方 Skill 混入。
无招在发布会上提到,目前网上约 15% 的公开 Skill 含恶意代码,和当年盗版软件植入病毒的问题如出一辙。这四道防线是默认开启的出厂设置,不是企业自己需要去配置的可选项。
![]()
悟空让一人团队成为现实丨来自:AI 钉钉 2.0 发布会
产品形态上,悟空推出了「OPT(One Person Team)」十大行业解决方案,首批覆盖电商、跨境电商、知识类博主、独立开发、门店、设计、制造、法律、财税、猎头。与 OpenClaw 那种「什么都能做但需要自己搭建」的开放框架不同,每个 OPT 方案直接交付的是完整的「场景化 Skill 套件 + 预编排工作流」——用户做决策和验收,AI 负责执行。
发布会展示了几组具体数字:一位律师使用悟空之后,可服务客户数量从 10 人提升到 200 人;跨境电商从选品到上架准备,核心环节从一周压缩到一个下午;一位独立开发者通过三次沟通录音,15 分钟生成一套可交付系统——发布会当天的购票系统本身就是用这个方式开发的。这些数字背后有演示加成是正常的,但数量级的变化是可信的。
这背后的逻辑是:Agent 要成为真正的生产力,首先要是一个标准产品,而不是极客玩具。
我自己的体验,是从一个看似简单的任务开始的:每天帮我整理竞品媒体的重要选题简报,通过钉钉发给我。
这个需求在过去的执行方式,要么是我自己某个固定时间逐一打开公众号翻看,要么安排一名实习生每天做这份信息整理工作。看起来是小事,但真正尝试让悟空来做,才发现它并不简单。
悟空是一个独立 App,需要用钉钉账号登录。打开之后,界面结构清晰:新的任务是一个对话式交互窗口,可以直接和悟空沟通你的需求;技能中心是一个 Skill Store,预置了各类行业场景模板,从商品素材生成到定制业务系统都有;定时任务则会记录你交给悟空的所有持续性任务,是它的 todo list。
![]()
悟空任务界面丨来自:悟空
我在「新的任务」里提了需求,整个交互过程大约二十分钟,是一次有意思的人机协作。
第一个卡点出现得很快:竞品媒体名单。悟空主动提议分析我应该关注哪些科技媒体,给出了一份初始名单。坦率说,在没有足够业务上下文的情况下,这份名单我不算满意——它基于泛化的行业知识在猜,而不是真正了解极客公园的竞争格局。这是一个典型的「通识足够,业务理解不足」的早期状态。我手动修正了名单,继续往下。
第二个卡点更有意思:如何抓取公众号文章。悟空最初的思路是直接访问这些媒体的官网抓取内容,但这对我来说没有价值——我关注的是竞品的关键选题判断,而不是他们官网的全部发布物,更重要的是,核心内容都在公众号,不在官网。我提醒它可以尝试搜公众号头条次条,它立刻意识到微信生态的封闭性,开始自己想替代方案。
它第一反应是用关键词过滤,比如抓取带「首发」、「独家」标签的内容。我直接告诉它这会有大量缺漏。它没有死磕,在我的提醒下,很快调整思路——主动学习了公关行业的舆情监控方法,找到了两条有效路径:新榜 API(付费,精准度高)和搜狗微信搜索(免费,但存在延迟和遗漏风险)。这两个方案它都给出了具体的实现逻辑,并说明了各自的适用场景和局限。
这个过程让我印象深刻。它不是在等我给答案,而是在我的提示下自己检索、判断、迭代解法。二十分钟之后,悟空已经配置好了一个每日定时任务:按我指定的媒体范围,通过有效渠道汇总当日重点文章,整理成简报,通过钉钉推送给我。
![]()
悟空在钉钉里发来了简报丨来自:极客公园
它真的跑起来了。
而且,这只是起点。理论上,我可以进一步让它分析这些文章的选题角度,与极客公园的已有选题做对比,甚至在发现高度重叠时主动提醒对应的记者同学。一个本来需要实习生每天花一两个小时做的信息整理工作,变成了一个可以持续运转、还能往上叠加智能判断的 Agent 任务。这不是 demo,这是真实发生在我工作流里的生产力变化。
当然,体验过程里也有值得记录的局限。悟空对没有喂养业务上下文的场景,初始判断确实粗糙;在需要突破封闭生态时,它的第一反应不总是最优解,需要人来纠偏。但关键在于:它的学习和调整是真实的,不是在表演理解——它真的改变了解法。
02
为什么是钉钉:
数字员工需要「通识教育」
悟空的发布,还有一个值得深究的背景:就在发布会前一天,阿里巴巴宣布成立 Alibaba Token Hub(ATH)事业群,通义千问事业部、悟空事业部等一并纳入其中,悟空事业部的定位被明确为「打造 B 端 AI 应用入口,将模型能力深度融入企业工作流」。淘宝、天猫、1688、支付宝、阿里云等 B 端商业能力的 Skill,将逐步接入悟空。
这意味着,悟空不只是一个产品发布,而是阿里在 B 端 AI 赛道的战略集结:把集团最核心的商业能力统一收口到一个企业级 Agent 平台上。问题是,为什么这个收口点是钉钉?
答案指向一个关键词:组织关系。
阿里云能提供计算资源,但它不知道一家公司的组织架构长什么样;支付宝能处理资金流转,但它不掌握谁有权审批这笔支出;淘天有交易数据,但它不清楚这家公司内部的汇报关系。只有钉钉,持有企业运转的三样核心资产:完整的组织架构、明确的权限体系、真实的审批流程。这三样东西,恰恰是 Agent 在企业里「安全干活」的基础设施,这是数字员工走进公司的前提条件。
这就是为什么阿里押注钉钉:不是因为钉钉模型最强,而是因为钉钉掌握了让 AI 安全进入企业的基础条件。
但这只解释了阿里内部的选择逻辑。更大的问题是:为什么钉钉能在整个 toB AI 赛道里占据独特位置?
这要回到一个很多人忽视的问题:谁来做数字员工的「通识教育」?
所谓通识教育,是指那些不属于任何一家公司的特定业务知识,但每个进入职场的人或 AI,都应该具备的基础能力:理解权限边界、掌握安全操作规范、遵守审批和合规流程。对人类员工来说,这些靠十几年的通识教育和职场培训、经历慢慢习得。但对数字员工来说,没有任何单一企业能靠自己的数据训练出这套常识——corner case 只有在横跨几百万个不同企业环境的规模上才能被发现和处理。
钉钉的现有规模是:8 亿注册用户、超 30 万付费企业客户,AI 钉钉 1.1 发布后三个月内跟进了超过 6.9 万条用户反馈,完成近 3000 项功能需求。这个规模意味着,钉钉所积累的企业操作用例密度,是任何单一企业永远无法复制的。它要做的,是把这些积累转化成数字员工的「通识教育」框架——安全常识、权限设计、职场基本规范由平台负责内置,企业特有的业务知识由数字员工在具体场景中自己学习积累。这个分工,才是 toB 数字员工可以规模化的路径。
![]()
企业级 AI 原生平台丨来自:来自:AI 钉钉 2.0 发布会
无招在发布会上用了一个判断来描述他对未来企业形态的预期:「Programmable Enterprise」——可编程企业。他的意思是:当 AI 能够通过 CLI 直接调用企业内所有系统的能力,企业就从一个依赖人工操作的组织,变成了一个可以被精确编程、让 AI 按照规则自动运转的系统。他说:「人财物事,全部进入可编程时代。」
这个判断成不成立,现在还很难说。但钉钉这样的办公平台,是目前最接近这个「可编程企业入口」的存在——它沉淀了组织数据、沟通数据、审批数据,现在加上了 CLI 化的执行层和跨平台 Agent 框架。这个组合,是其他任何单一产品短期内难以复制的。
更重要的是,这件事本质上存在飞轮效应:越多企业在钉钉上部署 Agent、积累用例,悟空对「职场安全常识」的理解就越深,通识教育框架就越扎实,新企业部署时面临的风险就越低——这反过来又降低了更多企业迈出第一步的门槛。
此外,钉钉作为企业 IM 的天然入口地位,让悟空避开了所有 AI 工具面临的最大障碍之一:用户切换成本。数字员工不是独立窗口里的「外来者」,它就生长在员工每天打开的工作界面里。这种无缝嵌入,不只是用户体验上的优势,更是数字员工真正进入工作流的必要条件。
但悟空的野心,显然不只是守住钉钉的地盘。
在我的体验过程中,有一个细节意味深长:悟空完成每日简报任务之后,我测试了一下能否把推送目标从钉钉换成飞书——按照悟空的指引配置了一个飞书群机器人,把 Webhook URL 提供给它,几分钟后,测试消息出现在了飞书群里。
一个钉钉的 Agent,把信息推送到了竞争对手的平台上。这不是 bug,这是设计如此。
悟空在发布时明确支持连接钉钉、Slack、微信、飞书等主流平台。这个选择背后,是一个清醒的战略判断:数字员工的价值,不是把用户锁在钉钉生态里,而是成为企业工作系统的通用基础设施——无论企业用什么IM,悟空都能在里面干活。
换句话说,悟空不是阿里系产品的延伸,而是阿里进入更广泛企业市场的入场券。对于大量使用飞书或企业微信的公司来说,迁移 IM 的成本极高,但部署一个能跨平台工作的 Agent 的门槛要低得多。悟空选择拥抱这些场景,而不是把它们排除在外,意味着钉钉并不需要先赢得 IM 的战争,才能赢得数字员工的战争。
这是一个值得关注的战略转向:从「守住存量用户」到「用 Agent 能力渗透增量市场」。
03
不成熟,但谁都拖不起
说了这么多悟空的优势和钉钉的战略位置,有一件事必须说清楚:今天的悟空还远远没有成熟。
它有 bug,有能力盲区,在某些 corner case 里依然存在安全隐患。就像没有任何一家企业真正解决了 OpenClaw 的所有安全问题,悟空也不例外。这不是对产品的批评,这是所有早期产品的客观现实——当年第一代智能手机也做不到今天我们认为理所当然的事情。
但问题是:不成熟,不等于可以等。
对企业来说,数字员工带来的生产力变革,性质上不同于此前任何一轮软件工具升级。Copilot 类工具是辅助人类工作的,能力边界由人来把控;但 OpenClaw 和悟空代表的 Agent,是能够自主执行任务、能力上限远超人类操作效率的生产力形态——它不是让你的员工工作得更快,它在某些场景里能做到人类永远无法做到的事情。
这意味着,企业对数字员工的态度,不能简单套用「等技术成熟了再考虑」的传统逻辑。
现实情况是:你的竞争对手已经在用,你的员工也已经在用——只是不是以受管控的方式。当一家企业说「我们暂时不部署 Agent」,它实际上并没有阻止 Agent 进入这家公司,它只是放弃了对 Agent 使用方式的管控权。员工会用个人账号调用各类 AI 工具处理公司业务、上传公司数据、用 OpenClaw 这样的框架做各种尝试。安全问题非但没有消失,反而以一种更难追溯、更难管控的方式存在。
拥抱悟空这样的企业级 Agent 平台,反而是更负责任的选择——至少,操作是在权限体系内的,数据是在可控范围内的,出了问题是可审计的。
![]()
钉钉 12 年丨来自:AI 钉钉 2.0 发布会
对钉钉而言,同样没有等待的余地。
下一代企业办公平台的核心战场,就是 AI 如何进入企业工作系统。今天,钉钉在中国企业 IM 市场的位置是毋庸置疑的,但这个位置在 AI 时代并不是护城河——如果钉钉不能成为企业数字员工部署的首选平台,如果它不能提供让 AI 安全、高效融入工作流的框架,那些今天选择钉钉的企业完全可能因为 AI 能力不足而迁移到别处。
这不是危言耸听。历史上,没有任何一个领先的平台,仅凭用户规模优势就安全穿越了技术范式转换。
悟空的发布,是钉钉迈出的关键一步。它不完美,但它指向了正确的方向——不是把 AI 能力堆在现有产品边上,而是重新思考当数字员工真正进入企业之后,平台应该提供什么样的基础设施。
今天,数字员工最需要的,不是更强的模型,也不是更好的技术框架,而是进公司的资格。而悟空,是钉钉打造的第一个数字员工。
*头图AI 钉钉 2.0 发布会
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
极客一问
你如何看待 AI 悟空?





京公网安备 11011402013531号