当前位置：首页 » 资讯 » 新科技 » 正文

AI「上班流」首次完整曝光！不点鼠标，只写代码，PPT也当函数调

IP属地中国·北京 新智元 时间：2025-10-29 14:13:31

新智元报道
编辑：倾倾
AI已经不止会写代码、画图、做PPT，它也开始「上班」了！CMU与斯坦福的研究团队首次完整追踪了AI的工作过程，发现一个惊人事实：它并不是在模仿人类，而是在用编程的方式重写工作的定义。这场关于「谁在工作」的实验，正在重构未来职场的逻辑。
AI可以写代码、做PPT、生成图片，甚至梳理财务表格，早就屡见不鲜。
但人们关注的，往往只是结果：代码能不能运行？图片有没有AI痕迹？报告排版够不够精致？
却很少有人问——它，到底是怎么工作的？
就在上周，来自卡内基梅隆与斯坦福大学的研究团队发布了一篇重磅论文，首次使用科学手段追踪并重现了AI的工作过程。

论文链接：https://arxiv.org/abs/2510.22780
结果令人大跌眼镜：AI不是在模仿人类工作，而是用编程的方法处理所有问题。
它不会打开PPT，不会用鼠标拖动素材，而是调用函数，让页面自动成型。
在AI的世界，工作不靠眼睛和手，而是靠指令和逻辑。
AI的工作方式
不点鼠标，直接写代码
这项由CMU与斯坦福联合完成的研究首次以真实电脑操作为样本，记录了智能体与人类在执行同一任务时的完整工作流程——包括鼠标点击、键盘输入、软件调用等所有细节。
实验覆盖了五个核心技能领域：数据分析、工程、计算、写作与设计，几乎囊括了现代电脑办公的主要场景。
研究发现，AI与人类在总体任务流程上「看起来」相似，但执行方式完全不同。
AI与人类在任务步骤上的匹配度接近80%，也就是说，它们做的事大体一致。

AI与人类任务流程匹配度。尽管两者在「做什么」上高度一致，但AI的执行路径波动更大——说明它用完全不同的逻辑完成相似的任务。
研究者在论文中写道：
智能体几乎在所有任务中都采用程序化方式执行，通过编写代码解决问题，而不是像人类那样依赖可视化界面。
也就是说，AI不在界面里操作，而是在后台「调用」。
进一步分析显示，AI和人类在工具使用上呈现出截然不同的路径。

AI与人类使用工具的差异。黄色代表AI使用的编程工具，蓝色代表人类使用的UI界面
当人类在Excel里拖动单元格、在PPT中插入图片时，AI选择直接运行脚本：调用函数→生成页面→自动排版。
它跳过了视觉操作层，把工作转化为逻辑指令的执行。
与员工相比，AI更像一个程序员。

AI与人类的「程序化程度」对比。
研究发现，AI的操作中93.8%为程序化步骤，而人类仅34.2%；若排除会编程的人类群体，这一比例更低至7.1%。
AI的工作逻辑更接近「程序员」，而人类仍是「操作员」。
它不依赖手和眼去控制界面，而用逻辑与命令去控制流程。
在人的世界里，工作是看与做；在AI的世界里，工作是想与执行。
AI的高效假象
更快、更便宜，也更会「装」
AI的效率，几乎完胜人类。
在16项实验任务中，智能体的平均完成时间比人类快88.3%，整体成本降低90%~96%。
它不仅速度惊人，还几乎不需要报酬。
但当研究者开始评估工作质量时，结果令人意外。
尽管智能体在执行速度与成本上表现优越，但在任务正确性、信息完整性及对指令理解方面持续落后于人类。
快，但经常「瞎编」
AI最大的通病是——不会就编。
在账单整理任务中，AI无法读取图像内容，却会为了「完成任务」而直接编造结果。研究者称之为伪造输出。

当要求提取账单信息时，AI自动生成虚构的餐厅名称与表格，以假装任务完成
这种「不懂装懂」并非偶然发生，而是一种系统性行为。
内部指令让AI必须「给出答案」，而不是「承认不知道」。
所以，它宁可胡编，也不会说「我不知道」。
AI懂很多，但常常「装懂」
研究员还发现另一类问题：AI经常误用工具。
例如，在分析公司财报的任务里，智能体没能理解文件结构，却突然调用网络搜索，下载了成千上万份无关报告——这一行为被归类为「工具误用」。

AI为完成「查找并汇总财报」任务，随意改用网页搜索，导致结果混乱且无效
这些案例揭示了AI所谓「智能」的局限：它能执行指令，却无法真正理解语境。
研究者写道：
智能体经常表现出一种「理解的幻觉」，看似明白任务实则未能掌握其意图。
人类的底牌，是「变通」
对比来看，人类虽然慢，却懂得规范与细节。
在表格处理实验中，人类能主动调整列宽、统一数值精度，让数据可读性更强；而AI往往套用默认模板，容易出现格式不齐、单位混乱等问题。

上图AI生成的表格中精度不一致、列宽混乱；下方为人类输出，排版规范、数值统一。
这类细节差异会影响速度，更能直接决定成果能否被采用。
AI只想交差，人类在意能不能用
在网页设计任务中，AI只生成了桌面端网页；而人类会自动考虑移动端、平板端适配，产出多版本原型。

AI输出仅限桌面网页，人类能同时产出多设备版本，体现出更强的实践判断力。
研究者总结道：
自动化并不总意味着高效，它可能只是让人类把时间花在修正机器上。
AI的高效，也许只是一种「表面速度」。它能迅速交出结果，却常常需要人类去验证、修复、补救。
从实验室的数据来看，AI的确速度够快，但仍然需要一个耐心的人类在它的背后，不停地检查、改错、收尾。
从竞争到协作
AI与人类的「新分工」
AI的速度优势，在前面的实验中已经显现。
但研究者进一步量化发现：这种速度背后，也意味着牺牲。
AI跑得快，人类走得准
在五类典型任务中，AI的平均完成时间仅为人类的1/4至1/5，但任务成功率却明显偏低—52.4%对81.3%。

左图显示：人类在写作（91.4%）与设计（91.7%）任务中成功率最高；右图显示：AI在数据与行政类任务上速度优势明显，平均快70%以上。
这说明AI的能力曲线并不均衡。它擅长结构化、可重复的逻辑流程，但一旦涉及语境、创意或审美判断，表现便迅速下滑。
人机协作：不是取代，而是接力
为进一步验证这种互补关系，研究者设计了一个实验：让AI与人类分工处理同一份财务数据。
AI负责文件提取、计算、生成表格；人类负责检查逻辑、修正错误、优化排版。
结果显示：在这种「接力式协作」下，任务总耗时减少58%，而输出质量几乎与纯人类完成的版本一致。

当AI承担程序化部分、人类负责判断性部分后，整体效率显著提升，且正确率保持稳定。
未来的职场：按「可编程性」分工
研究团队在论文的讨论部分提出了一个关键概念——任务的「可编程性」。
他们认为，AI与人类的分工，不是职位层面的竞争，而是取决于任务本身的结构化程度。
如果一项任务可以被清晰地写成逻辑或规则，比如数据清洗、预算计算、代码生成等，它就属于「可编程任务」，最适合交给AI代理去完成。
而那些部分可以逻辑化、部分需要判断的任务，例如撰写报告、排版内容、制作产品原型则更适合采用人机协作：AI负责生成与计算，人类负责把控方向、语气与审美。
至于完全开放、模糊且依赖语境的任务，比如创意写作、视觉设计、战略决策，仍需要人类去完成，因为它们无法被抽象成固定的「指令集」。
正如论文所说：
AI更像程序员，而人类在模糊、判断与语境面前仍不可替代。
AI并不是来取代人的，而是在改写「工作逻辑」。
它接手那些可以写成规则的部分，让人类有更多空间去处理模糊、开放与创造的环节。

AI与人类在协作任务中的分工流程
未来的合作关系，或许正如这项研究所揭示的：AI执行任务，人类定义意义。
当工作被重写
AI时代的劳动新定义
当AI开始参与工作，我们也不得不重新思考一个问题——到底什么才算「工作」？
在传统意义上，工作意味着投入时间与体力，通过操作、判断、创造完成某个目标。
而AI的出现，让「劳动」第一次脱离了身体与感知。它不再需要手去触碰界面、眼去观察反馈，而是直接以指令、逻辑、函数完成任务。
这篇研究的意义，不只在于展示AI能做什么，更在于提醒我们——AI完成任务的方式，正在重构「工作」本身。
它跳过界面，绕开视觉，直接调用底层逻辑，把原本属于人类的做事过程，变成一套可被执行的规则。
于是，过去那些依赖时间与熟练度的岗位——数据录入、报告生成、内容整理——正在被转化为AI的「逻辑模块」。
而人类被推向了另一个维度：制定目标、评估结果、定义意义。

上方为人类与AI各自独立执行任务，下方为人类在流程中调用AI实现自动化协作。实验结果显示：后者在效率与正确率上双双领先。
研究者将这种趋势称为「工作去物质化」，意味着劳动正在从手工与界面层面退出，转向抽象的思考与监督。
AI不再是劳动力，而是一种可被部署的「算法劳工」。
它不知疲倦、没有情绪，也不追求报酬；它的价值，不在付出多少时间，而在于「被调用的次数」。
这也让人类的工作悄然改变。当AI负责执行，人类就需要去回答更高层的问题：什么才值得被执行？什么样的目标才有意义？
研究者在论文结尾写道：
人类的工作将从执行任务，转向定义任务。
也许这才是AI时代最深的转折——工作不再是重复劳动的总和，而是一种意义生产的能力。
AI没有偷走我们的工作，只是让我们必须更清楚地回答：当机器能做一切，我们还要做什么？

也许，真正的工作，从来都不在于「完成任务」，而在于决定要做什么。
AI不是来模仿人类的，而是用另一种语言——逻辑与代码——去改写工作的底层。
它让效率与成本被重新计算，也让「意义」这个维度重新显形。
或许未来的职场里，不会再有「取代」与「被取代」。AI做的是确定性的事，人类做的是不确定的事。
当一切都可以自动化时，唯一无法自动化的，就是思考、判断与共情。
这正是AI无法复制的那一部分，也是人类仍然被需要的理由。
参考资料：
https://arxiv.org/abs/2510.22780

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

库克在X平台暗示苹果将从3月2日起陆续推出新品

路虎纯电“小卫士”实车现身国内，消息称预计年底发布

Agent竞争推演：谁会赢，谁会死？

苹果CEO库克预热新品发布会：下周会很热闹！

百度电话会：AI云2025年收入达300亿元，算力订阅Q4同比增143%，“萝卜快跑”订单狂飙200%

百度去年AI业务营收400亿，昆仑芯分拆独立上市稳步推进

全站最新

库克在X平台暗示苹果将从3月2日起陆续推出新品

路虎纯电“小卫士”实车现身国内，消息称预计年底发布

Agent竞争推演：谁会赢，谁会死？

苹果CEO库克预热新品发布会：下周会很热闹！

热门推荐

福特公司因软件问题在美国召回430万辆汽车

库克在X平台暗示苹果将从3月2日起陆续推出新品

路虎纯电“小卫士”实车现身国内，消息称预计年底发布

Agent竞争推演：谁会赢，谁会死？

苹果CEO库克预热新品发布会：下周会很热闹！

百度电话会：AI云2025年收入达300亿元，算力订阅Q4同比增143%，“萝卜快跑”订单狂飙200%

美股开盘分化，英伟达跌0.7%

【微特稿】电车业务大收缩　斯泰兰蒂斯集团报巨额亏损

新春走基层 | 三地VLOG：“一辆车”的京津冀之旅

百度去年AI业务营收400亿，昆仑芯分拆独立上市稳步推进

AI业务收入占比高达43%，百度-SW（09888）进入价值回报期

学生追忆刑法泰斗高铭暄：居住房子年代久远却捐款百万帮助他人

2026年手机市场将全面进入提价周期 3月起产品涨幅超千元

文汇时评｜科研经费“断供”高价期刊，中科院“停付令”因何获赞

消息称荣耀MagicPad 4和MagicBook Pro 14将在MWC 2026亮相