当前位置: 首页 » 资讯 » 新科技 » 正文

刚刚,MiniMax来承包你的桌面了

IP属地 中国·北京 机器之心Pro 时间:2026-01-20 20:26:32

机器之心编辑部

如果说 2025 年是 Agent 落地元年,那么刚刚开始的 2026 年势必迎来新一轮爆发。

一开年,Agent 赛道便进入到了白热化的竞争,国外如 Anthropic 发布 Cowork,国内如千问 APP 上线「任务助理」。在这一背景下,市场出现了分化,或专注于工作提效,或聚焦于日常生活体验重塑。

在这个红海市场,10 多天前登陆港股的国产 AI 大模型独角兽 MiniMax 选择的路线是「将释放生产力进行到底」。

1 月 20 日,MiniMax 揭开了其第二代智能体产品 ——MiniMax Agent 2.0 的面纱,为这个火热的 AI 赛道添加了又一个生力军。此次的更新被定义为了一个「AI 原生工作台」(AI-native Workspace),从产品形态和能力分布上进行了深度重构。

这个全新的工作台不再像过去那样依赖简单的 Chat 式对话框,而变身为能感知本地环境、自主拆解复杂任务且提供专家级专业技能的进阶型智能协作伙伴。这些能力实现的背后立着以下三大核心支柱:

首先是桌面端应用「MiniMax Agent Desktop」,它让 Agent 跳出了浏览器网页,而能在操作本地文件和本地环境的同时启动网页自动化任务。这意味着,该 APP 实现了本地与云端之间的无缝连接,通过一个全局视角渗透到各个职能角色的核心工作流中,将人类从「在不同窗口间切换、复制粘贴、点击按钮」的重复劳动中解放出来。

MiniMax 桌面端已经上线了 Windows 和 Mac 双版本。

其次是「Expert Agents」 ,打造垂直领域的顶级专家分身。Expert Agents 超越了现有预设的 Multi-agent 的 Pro 模式,通过封装私有知识和行业独家 SOP(标准操作流程),用专家级的知识、能力和经验储备来武装用户。

MiniMax 表示,1.0 时代依赖的 Multi-agent 多专家系统只能提供 70 分的通用专家组合,现在借助 Expert Agents 可以将这一分数拉升到 95 分甚至 100 分,可靠性有了质的提升。并且官方还会提供大量开箱即用的 Expert Agents,降低了操作门槛,上手更轻松。

用户现在可以在桌面和网页双端限时免费体验 Expert Agents 功能。

最后定义自己的 Expert Agents,通过更多的上下文信息和更自由的自定义设置,让 Agent 在更懂你的基础上提供个性化的专家服务。

如果说去年发布的 MiniMax Agent 1.0 定义了「靠谱的 AI 伙伴」,如今的 2.0 在同样确保结果的准确性之外,在 AI 原生自动化执行的广度、深度、专业度上来了波全方位加强。

一手实测:这个 Agent 真是能文能武

表现如何还得看实战。打开 MiniMax Agent 官网 ,下载最新上线的 MiniMax 桌面端,即可开启 AI 原生工作台体验,重塑工作流。



官网地址:https://agent.minimaxi.com/

安装完成后,在引导界面可以看到 MiniMax 桌面端已经深度打通本地文件,我们只需选定一个工作目录,即可让 AI 读取、分析、批量处理该目录下的所有文件。这一设计体现了其打造「AI 原生工作台」的核心思路。

下面就开始测试吧。

作为一家媒体,我们的日常工作中一大很重要的任务是刷选题,直接输入下面的提示词,看看我们能否在 MiniMax 桌面端中让 Agent 自主实现这个定时任务,提升我们刷选题的效率。

每天 9:00 为我提供过去 24 小时内 AI 领域的重点新闻摘要。每条新闻提炼一个核心要点,并附带网络检索来源,确保清晰易读



4 倍速视频

仅仅 2 分多钟,MiniMax 的 Agent 就成功完成了任务,正确编写了脚本并进行了可行性测试。不仅如此,该 Agent 还给出了后续实现定时任务的教程,让我们只需一些复制粘贴,即可在我们的设备上将这个 AI 任务变成每天上午的日常。下图总结了此次任务的执行结果:



而作为一家专业的人工智能媒体,读论文也是我们的一个日常,接下来我们试了试让 MiniMax 桌面端分析解读 MiniMax-M1 背后的技术脉络。

这是 MiniMax-M1 的技术报告 https://arxiv.org/pdf/2506.13585,研究其参考文献,了解其背后的技术,然后制作一个网页,展示 MiniMax-M1 背后的技术进化图谱,务必尽量往前追溯。

很显然,这个任务会更加复杂一些,耗时大概 6 分钟。



4 倍速视频

在执行过程中,Agent 首先分析了任务需求,然后调用工具下载了指定文档,之后对文档进行了分析解读以及技术追溯。之后,它又按照要求编写了一个网页来进行了展示。

最后,MiniMax 的 Agent 为我们创建了这样一个网页,:



不仅如此,该 Agent 还自动在 MiniMax Space 上部署了这个网页, 让我们可以直接使用和分享这个网页:https://sqwu1jsy96cd.space.minimaxi.com/

这种从研读到交付的闭环能力,展现了其在任务执行上的工程深度。

当然,得益于工作目录的设计,MiniMax 桌面端不仅能处理单篇论文,更能直接处理一个装满文件的文件夹。举个例子,我们的日常工作将会积累很多选题,其中包括一些高质量的技术博客,使用以下提示词,我们可以让 MiniMax 将这些博客从文档中提取出去,并制作成精美的 PPT 进行展示。

这是我们近几个月的日常选题整理文档,请梳理出其中所有的技术博客,并访问每篇技术博客的内容,给出简短的内容整理。将结果整理成一个 PPT,每一页展示一篇技术博客,其中应包括一些引用自博客的图片或截图、博客标题和链接以及内容简介。使用莫兰迪色系。

这个任务就更加复杂了,而且非常繁琐,也因此我们此前都没去处理。而在 MiniMax 桌面端的帮助下,我们仅用 23 分钟时间就完成了整个任务。



16 倍速视频

可以看到,我们的初始文件是一大堆的 docx 文档,MiniMax 桌面端首先调用工具将所有这些文档转换成了 LLM 最喜欢的 markdown 格式,然后读取详细内容,并提取出了分散在各个文档中的技术博客。之后它继续调用工具,读取了文档中这些技术博客链接的具体内容。之后它继续推进,将这些内容总结成了适合制作 PPT 的文案,接下来,还是调用工具,它使用这些文案生成了图像和演示 PPT。

至于效果,可以说是超乎想象地好。



通过以上测试示例,我们看到了 MiniMax 桌面端在日常工作中对我们的强大助益,同时,我们也看到了将 Agent 接入本地计算机的无限可能性。

举个例子,对以上视频的加速处理,我们也完全是通过 MiniMax 桌面端完成的。而我们所做的,不过是输入了这样一段提示词:

处理一下文件夹中的视频:将 MiniMax-1 和 2 加速 4 倍,将 3 加速 8 倍,将 4 加速 16 倍。我本地已经安装 ffmpeg。

Agent 精准识别了本地环境中的工具路径,并生成了对应的处理指令。无需用户手动输入复杂的命令行参数,视频加速任务便在后台安静、高效地完成了。



最后,我们还简单尝试了 MiniMax 提供的专家 Agent 创建能力。据介绍,该功能「允许用户构建在特定领域达到 95 分甚至 100 分的领域的专家 Agent。不仅仅是简单的 prompt 调整,而是深度的知识与能力注入。」

创建过程非常简单直观。在对话框左下方选择「子代理」→「管理子代理」,即可创建出可以多次复用的 Agent,比如这里我们简单创建了一些「专家」。而在每个 Agent 的配置中,我们也可以选择启动不同的工具。



之后,我们只需在开启任务之前选择我们想要使用的子代理,即可将相应的 Agent 纳入到我们的工作流程中。比如在下面的例子中,我们启用了上面配置的一系列专家,然后让它们围绕「AI 究竟是什么」进行了一系列深度探讨。这时候,MiniMax 本身会化身这场多智能体讨论的主持人,通过在探讨中调用不同配置的子代理,实现对这一话题多视角反复深度讨论。



这项能力具有巨大的想象空间。它意味着用户可以将行业经验、部门 SOP 甚至复杂的业务逻辑转化为可调用的模块。当用户面对一项复合任务时,不再是与一个通用模型交谈,而是指挥一支由特定领域专家组成的数字团队。这种从「单点能力」向「专家协作」的转变,为大模型在专业垂直场景的落地提供了更具实操性的路径。

整体体验下来,我们看到 MiniMax Agent 能够理解复杂的 SOP 流程,自主调用本地与云端工具,将原本需要多款软件协作的任务浓缩在单一的提示词输入框中。这种以任务完成率为核心的设计,正是 MiniMax 试图定义的 AI 原生工作范式。

从刷分到会干活:MiniMax 正在重新定义 AI 能力边界

总结来看,MiniMax Agent 2.0 并不是在展示它想得有多聪明,而是在证明它能把事做到哪一步。

在 Agent 2.0 的工作方式里,AI 不再等待人类一次次补充上下文,而是主动进入工作环境,理解你的文件、网页、工作流程,持续推进任务本身。你只要给出一个指令,剩下的拆解、执行与跟进,交由 Agent 在 Workspace 中完成。

这也解释了为什么 MiniMax 要把 Agent 2.0 定义为 AI-native Workspace。

这背后,是MiniMax 在模型层面的持续升级,以及一套在内部真实运转的工作方式

去年 6 月提出的 Lightning Attention 将长序列计算成本从二次方降为线性,让 Agent 不再失忆;10 月发布的 M2 定位为 Agent & Code Native,采用交错思维机制和 MoE 架构(230B 总参数、10B 激活),API 价格仅为 Claude Sonnet 4.5 的 8%;12 月的 M2.1 则向 Rust、Java、C++ 等后端语言深入,使得模型具备全栈工程能力。

而这些能力,首先被 MiniMax 自己用在了内部。模型被直接嵌入研发与办公的核心流程,从写代码、拆需求到跑 Agent 任务。据了解,在过去数周内,MiniMax 内部接近 100% 的同学开始使用 Agent 实习生。

这样一来,模型能力的每一次升级,都会在真实业务中被高频使用和反复打磨,而内部产生的反馈,又返回到下一轮模型和系统设计上来,形成了一条快速自我强化的迭代闭环。

此次 MiniMax 定义的「AI 原生工作台」将掀起一场对 AI 参与高复杂度工作的价值重构。其中一点是交互逻辑发生了变化,从「人要被动适应 Agent」变为「Agent 主动适应人」。另外通过定制化的 Expert Agents,专业壁垒被打破,普通人无需经历漫长的学习就能获得行业顶级的知识与经验。

文中视频链接:https://mp.weixin.qq.com/s/I2RgH04J2l5mG1x492T17A

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。