还在只盯着龙虾看吗,那你已经落伍了。
如今AI圈里最火的已经不是养虾,而是养马。
Hermes Agent由Nous Research团队开发,官方表示Hermes指的是古希腊神话中的神祇,而Nous指的是古希腊语中直接感知真理、理性以及神圣现实的能力。

目前在OpenRouter的数据里,Hermes Agent每日全球排名第二,在编程Agent和CLI Agent类别均排名第一,过去一个月调用量超过1.6万亿Token,使用模型包括Qwen3.6 Plus、MiMo-V2-Pro、MiniMax M2.7、Claude Opus 4.6等。

不仅如此,Hermes Agent是有史以来增长速度最快的代理商。,Hermes Agent两个月就拿下了近六万GitHub星标,且持续霸榜 Github Trending。OpenClaw从0颗星到4万颗星,用了61天。Hermes只用了45天就做到了。仅在过去7天内,Hermes获得的星星数量就是OpenClaw的3倍——史无前例。

从2月25日首次发布,到现在的V0.8.0,Hermes保持着高频的版本迭代节奏,是当前最活跃的开源Agent项目之一。
此外,官方在X平台表示Hermes Agent现在原生支持个人微信了。 微信扫码即可连接,私聊群聊都支持。图片、视频、文件、语音消息全覆盖,长轮询直连,不需要公网 IP。

它和Claude Code、OpenClaw的区别
理解Hermes是什么,最快的方式是把它放在现有工具的坐标系里对比。
Claude Code活在你的代码仓库里。它读代码、写代码、跑测试、提交变更,是目前最强的编码智能体之一。但它不会在服务器上独立运行,不会在你睡觉时执行定时任务,也没办法通过飞书给你发消息。
OpenClaw解决了离开笔记本这个问题。它可以部署在服务器上,接入消息平台,执行终端命令,管理日程,控制浏览器。它把AI从聊天框里拉出来,嵌进了实际的工作流。
但OpenClaw有一个根本性的局限:它的记忆是静态的。你把信息写进配置文件,它读取并执行,会话结束之后一切归零。它不会从执行过程里自动提炼什么,也不会因为你纠正过它一次就在下次自动调整。所有工作流用过一遍,下次还是要重新提醒它。
Hermes在OpenClaw的基础上,加了一套从底层架构设计的学习循环。这不是靠额外的技能插件打补丁出来的,而是内建在整个执行引擎里的核心机制。

(图源:爱马仕橙皮书)
差距最大的两个维度是学习能力和用户建模。OpenClaw的Skill主要靠人工编写和调整,它的进化依赖社区和用户的主动维护。Hermes用的越久,Skill越精准,记忆越深,做事越顺手。
不是助手,是会成长的搭档
大多数AI工具解决的是当下这一次的问题——你问,它答,会话结束,什么都不留下。
Hermes Agent想解决的是另一件事:让AI记住上次怎么做的,让它在第30天的表现和第1天不一样。
这是Nous Research构建Hermes的出发点。不是更聪明的聊天框,而是一套部署在服务器上、持续运转、会从执行经验里自动沉淀能力的自主智能体框架。
学习循环:Hermes 的心脏
Hermes的核心差异点叫做闭合学习循环(Closed Learning Loop)。
每次任务完成后,它会自动复盘三件事:哪些信息值得记住、有没有可以提炼的Skill、已有的Skill需不需要根据这次反馈优化。系统还内置周期性唤醒机制,即使没有新任务,也会定时回顾最近的交互,判断有没有值得沉淀的东西。
系统还内置了一个周期性唤醒机制(Periodic Nudge)——即使没有新任务进来,Hermes也会定时回顾最近的交互,判断有没有值得沉淀的东西。有点像手机弹出的日记提醒:今天有什么值得记录的?只不过这里不需要你去回答,Hermes自己决定。
学习循环分三个环节:
策划记忆。 对话结束后主动提炼,不是把聊天记录堆进数据库,而是判断什么值得留下,写入 SQLite 并建好 FTS5 全文索引。传统工具是录像带,越录越长;Hermes 是日记本,只记有价值的。
自主创建 Skill。 完成复杂任务后,Hermes 会判断这个解决方案以后是否还会用到。如果是,就把执行过程提炼成 markdown 文件存入 ~/.hermes/skills/,下次遇到同类任务直接加载,不从零开始。
Skill 自改进。 Skill 不是写死的。你给了反馈或做了纠正,Hermes 会回去修改文件本身,用 patch 方式只改有问题的部分,不整体重写,下次执行时改进后的版本自动生效。这样更安全,原来好用的逻辑不会被一并覆盖,token 消耗也更低。
三层记忆:Hermes 的大脑
学习循环产生的内容,需要一套分层架构来承载。Hermes用三层记忆解决这个问题,每层回答不同的问题,各司其职。
第一层:会话记忆——发生了什么?
每轮对话的内容、工具调用和返回结果全部写入SQLite数据库,同时建 FTS5 全文索引。
关键设计是按需检索,而不是全量加载。新对话开始时,Hermes不会把所有历史都塞进来,而是根据当前话题用FTS5搜索相关片段,只加载需要的部分。效果是上下文占用基本恒定,响应速度不会随使用时间变慢,理论上可以持续用几个月甚至几年。所有数据存在本地,不上传任何服务器。
第二层:持久记忆——你是谁?
这一层存的不是对话内容,而是从对话中提炼出来的持久状态:编码偏好、项目习惯、常用工具链、工作时间规律。这些跨会话保持,开启新对话不会丢失。
可选的Honcho用户建模系统在这一层之上再进一步——不只记录你说了什么,而是从你的行为模式里推断你是什么样的人。你从来没说过我喜欢简洁的代码风格,但Honcho通过分析你多次修改代码的行为,得出这个结论,之后生成代码时默认走简洁路线。它甚至能捕捉到言行不一致的地方:你嘴上说要写完整注释,但实际review代码时从不看注释——Honcho会同时关注这两面,而不是只听你说的。
第三层:Skill 记忆——怎么做事?
第三层记住的是方法论和操作规范。每个Skill 是 ~/.hermes/skills/ 下的一个markdown文件,可读可编辑,来源有三种:安装时自带的40+预置Skill、Agent从经验中自主创建的、以及从社区Skills Hub安装的。
三种来源不是并列关系。预置Skill是起点,Skills Hub是加速器,Agent自主创建才是Hermes真正的差异所在——同一个写代码的 Skill,Python开发者和Rust开发者用三周后,会演化出两个截然不同的版本。不是通用模板,是从你的使用习惯里自然生长出来的。
Hermes的Skill遵循agentskills.io开放标准,目前已有30+工具支持,包括Claude Code、Cursor、Copilot、Gemini CLI。你为Claude Code积累的Skill可以直接在Hermes里调用,反过来也一样,Skill资产不会被锁在某一个工具里。
三层的协作方式实操: 你说帮我部署这个项目,Hermes先用FTS5搜索会话记忆,找到你上次部署时遇到的端口冲突记录;再查持久记忆,知道你用的是阿里云ECS和Nginx反向代理;最后加载deployment-checklist这个Skill,按你验证过的步骤执行。三层各司其职,一次调用完成。
这对应了认知科学里的三种记忆类型:情景记忆(发生过什么)、语义记忆(你是谁、你的偏好是什么)、程序性记忆(怎么做事)。人类学骑自行车也是这三层的协作:记得上次摔了(情景),知道重心要放低(语义),身体会自动保持平衡(程序性)。Hermes 处理任务的逻辑与此类似。
关于局限性: 记忆系统目前没有自动过期机制,长期使用后数据库会持续增长,建议定期检查 ~/.hermes/ 目录大小,清理过时的Skill文件。如果早期对话中写入了错误信息,这个错误可能持续影响后续行为,所以定期审查记忆内容和Skill文件是有必要的——就像整理笔记本,偶尔翻一遍,发现不合适的就修正。
部署在哪里,就在哪里陪你
Hermes支持六种运行环境:本地、Docker、SSH、Daytona、Singularity和Modal。Daytona和Modal提供无服务器持久化——Agent空闲时休眠,有任务时唤醒,闲置成本接近于零。你可以把它跑在一台5美元的VPS 上,也可以部署在GPU集群里,不需要一直连着你的笔记本。
消息平台方面支持超过15个,包括Telegram、Discord、Slack、飞书、微信、企微、WhatsApp、Signal、Matrix、电子邮件,以及Home Assistant等智能家居平台。一套网关进程统一管理所有渠道,会话可以在不同平台之间无缝衔接。
模型选择上没有锁定。支持Nous Portal、Anthropic、OpenRouter(200+ 模型)、DeepSeek、阿里云DashScope(Qwen系列)、GitHub Copilot,以及任何OpenAI兼容接口,包括本地的Ollama模型。切换模型只需要一行命令hermes model,不改代码,不重新配置。
值得一提的是,小米MiMo-V2系列目前已完成与Hermes的官方集成,包括支持百万上下文Token的MiMo-V2-Pro、具备全模态理解能力的MiMo-V2-Omni,以及轻量版Flash模型,并提供两周限免试用。

内置工具与辅助模型编排
Hermes内置超过40种工具,覆盖网页搜索、终端命令、文件系统操作、浏览器自动化、图像识别、图片生成、文字转语音、代码执行、子智能体派发、记忆管理、任务规划和定时调度。
浏览器控制方面,Hermes内置Camoufox——一个不会留下自动化工具特征指纹的隐身浏览器,能绕过大多数针对无头浏览器的检测机制。配合Firecrawl做结构化内容提取,可以构建稳定的网页监控和数据抓取管道。
Hermes还有一个辅助模型(Auxiliary Models)机制,专门处理不值得占用主模型的高频侧任务——图像分析、网页提取、技能匹配、记忆整理等,默认优先调用Gemini Flash自动处理,无需手动配置。这让主模型专注于真正需要推理的任务,边角工作切到更便宜的模型完成。
定时自动化与子智能体
Hermes内置cron调度器,支持自然语言设置定时任务——日报、夜间备份、每周审计,设置一次,自动运行,结果投递到你指定的消息平台。
对于需要并行处理的复杂工作流,Hermes支持派发隔离的子智能体,每个子智能体有独立的对话上下文、终端环境和Python RPC脚本调用通道,互不干扰,结果汇总回主进程。
安装与迁移
安装只需要一行命令,支持Linux、macOS、WSL2,以及通过Termux在Android设备上运行(原生 Windows 不支持,需先安装 WSL2)。
安装程序会自动处理Python 3.11、Node.js v22、ripgrep、ffmpeg等所有依赖。
如果你之前使用OpenClaw,一行命令可以完整导入原有设置:
Bashhermes claw migrate
人设文件、记忆、自建技能、API 密钥、消息平台配置,全部自动迁移,五分钟以内完成。
X上已经有人整理好了完整安装教程,难道新一轮的装马服务又要开始?

新的方向
Hermes解决的核心问题只有一个,但这个问题过去没有人真正解决:让Agent不再是用完归零的一次性工具,而是一个能从失败里学到东西、能把经验沉淀成能力、会随着使用时间变得越来越懂你的长期搭档。
这个方向对不对,用几个月就能给出答案。





京公网安备 11011402013531号