返回 FEED
AGENT2026-06-08

把 Hermes Agent 当一台个人 AI 操作系统:分层、Profile、/goal、与 Claude Code/OpenClaw 的真实分工

把 Hermes Agent 当一台个人 AI 操作系统:分层、Profile、/goal、与 Claude Code/OpenClaw 的真实分工

市面上多数 agent 框架,本质是跑在 LLM 之上的"应用"。能推理、能调工具、能在单 session 内维持 context。但它们普遍缺四样底层机制:长程结构化持久化、负载隔离、能力自主扩张、跨组件长期可靠协调

Nous Research 出的 Hermes Agent 在架构上明确往这四样补了一整套。它跨 session 持久化记忆、用 Profile 跑多个隔离执行上下文、用 Kanban 做结构化任务编排、能从自己的活动里派生可复用 procedure、还接了 27+ 通讯平台。

YanXbt 把它当作"个人 AI 操作系统"来读,2026 年 6 月的最新可观察版本是 v0.16.0 "The Surface Release"。

9 个 OS-style 层

把 Hermes 的组件映射到传统 OS 的概念上:

1. 记忆层(4 个子层)

Hermes 不把所有相关东西塞进单一 context window,而是维护多个独立记忆层:

  • Session Memory:任务/会话期间活跃的 context,典型短命,绑当前 session
  • Long-term Memory:事实、洞察、用户偏好、积累知识,跨 session 和重启活下来;可配置上限防无限增长
memory:
  memory_enabled: true
  user_profile_enabled: true
  memory_char_limit: 2200    # ~800 tokens
  user_char_limit: 1375      # ~500 tokens
  • Skill Memory:可复用 procedure 的结构化存储,由 agent 从过往成功工作中创建或打磨。存为 ~/.hermes/skills/ 下的普通 markdown 文件
  • Session Recall:FTS5 全文检索 + LLM 摘要,跨完整会话历史查询

"提醒我上个月我们聊过的每个商业想法。3 周前跑的那个竞品分析是什么?"

外部还有 8 个 memory provider 插件:Mem0(知识图谱+语义检索,每 turn 只注入相关条目,比全量注入省 72% token)、Honcho(USER+AI 双观察的对辩记忆,可自托管以满足 PII 敏感场景)、以及 Hindsight、Holographic、RetainDB、ByteRover、Supermemory、OpenViking 等不同架构的 provider。

hermes memory setup     # 交互式选择 provider
hermes memory status    # 确认激活的是哪个

多层记忆是 Hermes 像"持久系统"而非"对话 agent"的根基。

2. Profile(单机器多租户)

Profile 让用户在同一台机器上创建并运行多个隔离的 agent 实例。每个 Profile 独立持有:

  • 配置和模型选择
  • 记忆存储(session + long-term)
  • 已装 skill
  • Gateway 连接和关联凭证
  • 会话历史
  • Telegram bot token
  • Cron jobs
  • 状态数据库
hermes profile create researcher
hermes profile create ops
hermes profile create content-lead

每个 Profile 变成独立命令:

researcher setup          # 配模型和 API key
researcher chat           # 开 session
researcher gateway start  # 接 Telegram

典型 Profile 配置示例:

researcher:
→ soul.md: deep research only. facts and numbers.
→ model: gpt-5.5 (cheaper, high volume)
→ tools: web search, firecrawl, browser-use

ops:
→ soul.md: admin tasks. calendar, email triage.
   ask for approval before sending anything.
→ model: gpt-5.5 (routine tasks)
→ tools: email, calendar, notion

content-lead:
→ soul.md: produce content. match my voice.
→ model: claude-sonnet-4 (strong writing)
→ tools: X search, web search, analytics

Profile 可以通过 git 分发

cd ~/.hermes/profiles/researcher
git init && git add . && git commit -m "initial"
git push origin main

任何人可以装:

hermes profile install github.com/you/researcher

他们填自己的 API key。Skills、soul.md、workflow 跟着走;记忆和会话留在本机。

注意:Profile 隔离是功能性的、实用主义的,不能等同于传统 OS 那种 process 隔离的安全保证

3. Kanban(编排主干)

Kanban 是 Hermes 的协调和状态管理层,负责:

  • 创建和跟踪任务
  • 管理任务间依赖
  • 处理状态转移
  • 任务/Profile 之间交接时 transfer context
  • 记录每次任务尝试的执行历史和结果

状态机:Triage → To-Do → Ready → Running → Blocked → Done → Archived

Dispatcher 每 60 秒跑一次,自动分派任务给可用 worker,追踪心跳,检测僵尸进程,管理 retry 预算。

hermes kanban list    # 看 board
hermes kanban swarm   # 起完整多 agent 系统:
                      # root orchestrator + parallel workers
                      # + gated verifier + gated synthesizer
                      # + shared blackboard

早晨工作流示例:

/goal here is my to-do list for today:

1. research trending AI topics on X
2. draft 2 posts based on findings
3. check inbox and flag urgent emails
4. pull competitor posts from last 24 hours
5. update content calendar in Notion

add each task to kanban triage.
assign to sub-agents where possible.
send me a summary on Telegram when all tasks are done.

一个特别重要的设计是 "Blocked" 状态——任务进入这个状态会暂停执行直到人给输入或解除 block。这种设计让人类监督是工作流结构化和原生的一部分,不是外部临时干预。

把任务当一等公民、保留 context 和历史,能显著减少多 agent/多步 workflow 中常见于 handoff 的信息丢失。

4. Cron(proactive 层)

Cron 是用自然语言写的时基自治任务,不要 crontab 语法

这一层把 Hermes 从"被动工具"变成"主动系统"——有用信息在你开口之前就到位。

生产 cron 示例:

Every morning at 8am:
send me one AI story worth reacting to on X.

Every 3 hours:
scan X for fresh posts in my niche I should quote tweet.

Every day at 9pm:
check if competitors posted any outlier content today.

Every Monday at 9am:
audit my content board. flag ideas stuck for more than 7 days.

Every Friday at 6pm:
generate weekly content report and send to Telegram.

每个 cron job 跑在自己 session 里,能调工具、能选模型,能写回 agent 的记忆和 skill。Cron 系统感知 Profile——researcher 和 ops 可以各有自己的 schedule。

5. /goal(持久目标)

/goal 是 Hermes 一个区分度极高的特性。不像单次 prompt,/goal 是跨多 turn 甚至跨 session 持续工作的目标

关键特性:

  • 状态跨 session 持久化——昨天开的 /goal 今天仍然活跃
  • 绑 Profile——每个 Profile 有自己的活跃 /goal
  • 取消是一等动作——/goal cancel [id]abort
  • 进度可观察——/goal list 列出所有活跃目标
/goal [outcome] using [sources]
with constraints: [constraints]
deliverable: [deliverable]

结构故意极简:outcome、sources、constraints、deliverable。Agent 解析、规划、持续工作直到 deliverable 存在。

6. Skill(自我扩张的能力)

Skill 系统是 Hermes 最区别于其它框架的特性之一。Agent 能从自己成功的 workflow 里创建新 skill 并存为可复用 procedure。

当 agent 完成多步任务成功时,它可以:

  • 写一个新 SKILL.md 到 ~/.hermes/skills/
  • 用普通 markdown 文档化 procedure
  • 之后作为一等 capability 复用

这是 Hermes 能力随时间复利的机制。用了一个月的用户,已经通过积累的 skill 实质性地扩展了 agent 的能力表面。

但要清楚它不是什么

  • 是"无需提示自主运行"那种自主
  • 是默认就高质量——需要策展
  • 是默认版本化(虽然可以)

7. Gateway(27+ 通道)

Gateway 是 Hermes 触达你"已经在的地方"的表面层。通过统一协议支持 27+ 平台:

  • 聊天类:Telegram、Discord、Slack、WhatsApp、Signal、Email
  • 协作类:Mattermost、iMessage、Teams、Matrix
  • 工作类:GitHub Issues、Linear、Jira(既可输入也可输出)
  • 自定义 webhook

这一层通过 **SSEP(Server-Sent Events Protocol,v0.16.0 引入的新 gateway 协议)**和系统其它部分连接。SSEP 把跨所有平台的事件投递标准化,所以同一个架构能覆盖 Telegram DM、Discord thread、email thread。

Gateway 感知 Profile:每个 Profile 可以有自己 Telegram bot、自己的 channel set、自己的消息路由规则。

8. Voice 层

Hermes 通过三种模式支持语音:

  • 唤醒词检测("Hey Hermes")
  • Desktop app 上 push-to-talk
  • 持续对话模式

语音输入尽量本地处理、转写,然后走和文本输入同一条 agent loop。Voice 层用 Whisper 做转写,支持多个 TTS 引擎做输出。

9. Tool Search(动态工具加载)

Tool Search 按需加载工具 schema,不是每次 prompt 注入所有可用工具定义。这是 Hermes 最重要的 token 优化之一。

默认 agent 看到一小套常驻工具 + 一个 tool search 接口。当任务需要某个工具时,agent 按名/类别/描述搜它,只载入相关 schema。

配置启用:

tools:
  tool_search:
    enabled: auto    # 按需加载 schema

对于一个跨 MCP server、Profile、skill 拥有数百工具的 agent,这一个特性就能省 50%+ token。

没人讲的那部分:6 个 token 优化杠杆

24/7 跑 Hermes 如果每个 cron 都打 frontier 模型会很贵。系统内置 6 个优化杠杆:

1. 模型按任务类型匹配

不是每件事都需要最强模型。这是最大的成本杠杆。

content-lead profile:
→ model: claude-sonnet-4 (强写作、中成本)

researcher profile:
→ model: gpt-5.5 (便宜、靠 Codex 高量推)

ops profile:
→ model: gpt-5.5 (日常任务、划算)

code-reviewer profile:
→ model: claude-opus-4-8 (只为复杂推理)

复杂 /goal 用 frontier。日常 cron 和 triage 用便宜模型。一次切换月度账单减半。

2. 给轻量 Profile 降 memory 上限

默认每 turn 注入 2,200 字符 (~800 token) memory。50 turn 的 /goal session 就有 40K token 在重复注入 memory。不需要深个人 context 的 Profile:

hermes config set memory.memory_char_limit 1000
hermes config set memory.user_char_limit 500

3. 给每 Profile 设合理 max_turns

# research 和 content(短、聚焦)
hermes config set goals.max_turns 20

# code 任务(长、需要多轮迭代)
hermes config set goals.max_turns 50

50 turn 在 Opus 上一个 session 可能 $5-12。按 Profile 设 max_turns,别全局设。Research Profile 很少需要超过 20。

4. 启用全部 6 个 token 优化

tools:
  tool_search:
    enabled: auto    # 按需加载 schema

memory:
  memory_char_limit: 2200    # 不需要就调低
  user_char_limit: 1375      # 不需要就调低

加上:prompt caching(Anthropic 自动)、/compress 用于长 session、子 agent 委派做并行工作。

5. 用便宜辅助模型做副活

Hermes 把压缩、视觉、网页摘要、审批打分、工具路由、session 标题这些都 offload 到辅助模型。每个槽位独立可配。给它们用便宜快模型,主力模型保留给主活儿:

hermes model
# set main model: claude-sonnet-4 (质量)
# set auxiliary: a fast cheap model (compression, routing)

这意味着 /compress 和自动压缩跑在便宜 token 上,不是你主模型的价。

6. 调压缩阈值

compression:
  threshold: 0.50    # 默认:context 50% 时压缩

调到 0.30-0.40 更激进。Session 更轻,token 在 compressor 触发前累积更少。

还有无损 context 管理(LCM)

context:
  engine: "lcm"    # 插件,替代默认有损压缩

默认 compressor 是有损的——它摘要并丢老 context。LCM 是插件替代,保留全部 context 不丢同时优化 token 使用。通过 hermes plugins → Context Engine 可用。

最后是用 /usage 监控

/usage

定期跑。跨 session 比 token 数。如果某 cron job 烧的 token 比预期多,简化它的 prompt 或换便宜模型。

最便宜的路径:所有东西走 GPT-5.5 via Codex($20/月 ChatGPT 订阅,含推理)。把 Claude 或 Opus 留给那些"推理质量真的让你的输出有可测量差别"的 session。

诚实的局限

Hermes 有几个真实的架构强项,但仍然是一个演化中的系统,不是一个成熟个人 OS:

  • Desktop App 显著改善了可达性,但对所有 tool 交互还没有和 CLI/TUI 100% 能力对等,特别是复杂 browser 自动化和某些 local 集成
  • 大量并发 agent很长 workflow 会给模型 context window 和推理资源造成实质压力,需要谨慎的资源管理
  • Profile 隔离对很多用例实用,但提供不了传统 OS process 隔离同级的健壮性或故障隔离
  • 自主 skill 创建是 promising 方向,但成熟度和可靠性仍参差;高质量可复用 skill 常常仍需要人策展
  • 长 session 的 auto-compaction 可能造成 context 丢失;Autonomous Curator 和 session recall 是部分解法
  • 某些高级 tool 集成在 CLI/TUI 里比 Desktop App 或 messaging 界面更稳
  • SSEP gateway 协议是新的(v0.16.0),少见 messaging 平台可能在 per-platform 渲染上存在边界 case

这些限制主要是实现成熟度,不是根本架构缺陷。项目仍在活跃开发。v0.16.0 "Surface Release" 一次就含 874 commits、542 合并的 PR、170 位社区贡献者。前一版 v0.15.0 "Velocity Release" 含 1,302 commits、747 合并的 PR、321 位贡献者。

怎么和 Claude Code、OpenClaw、CrewAI 比

评估 Hermes 时最常被问的问题:它和 Claude Code、OpenClaw、CrewAI 怎么比?答案是它们解不同问题,根植于不同哲学

用所有三者的 builder 给出的心智模型

Claude Code 是你桌边的日常 driver。最好的 raw coding agent。如果活儿是"写代码、重构代码、debug 代码、理解这个 codebase",Claude Code 赢。

Hermes Agent 是你的 24/7 基础设施。你睡着时它在跑、用 Profile 管多个 workload、靠 skill 和 memory 复利、从 Telegram 任何地方找到你。

OpenClaw 是 chat-first 助手。最大 marketplace、最简单的 managed hosting($3/月)、最强的非技术用户体验。

CrewAI 是你的编排框架。当你需要多个专门 agent 在 Python 的一个定义好的 pipeline 上协作。不是 standalone agent,而是用来构建多 agent 系统的框架。

一个独立测试把同样的 18 个 prompt 跑过 Claude Code (Opus 4.7)、OpenClaw (Sonnet 4.6)、Hermes Agent。Hermes 赢 14/18。输的 4 个是 raw coding 任务——那种 Claude Code 的 codebase 理解无可匹敌。赢的 14 个是memory 和历史 session context 起决定作用的任务

结论:Hermes 赢在 history 重要时,Claude Code 赢在 code depth 重要时。它们是补的,不是争的。

Hermes 出了一个内置迁移命令 hermes claw migrate,专门从 OpenClaw 迁。当一个产品给一个特定竞品发命名迁移命令时,定位就清楚了。

三条上手路径

路径 1 — 15 分钟(最快看到结果)

# 安装
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# 一条命令 setup(模型+工具+gateway)
hermes setup --portal

# 接 Telegram
# 给 @BotFather 发 /newbot → 复制 token
# 粘到 hermes setup 问你的输入框

# 第一个 cron job
hermes chat
> "every morning at 8am send me a summary
   of trending AI news to Telegram"

# 完。明天早上你不用开浏览器就有简报

路径 2 — 一个晚上(完整个人 setup)

  1. 装 Hermes 跑 hermes setup --portal
  2. 接 Telegram(BotFather → token → 粘)
  3. 建第一个 Profile:hermes profile create work
  4. 写 soul.md 定义 agent 怎么行为
  5. 设 3 个 cron(晨间简报、竞品检查、日 review)
  6. 跑第一个结构化 /goal
  7. 开 dashboard:hermes dashboard
  8. 一周后 review skill,删弱的,调强的

路径 3 — 完整 OS(周末项目)

  1. 起一台 Hetzner CX22 VPS(~$7/月)
  2. SSH 上去装 Hermes
  3. hermes setup --portal
  4. 接 Telegram gateway:hermes gateway start
  5. 建 3-4 个 Profile(content、research、ops、code)
  6. 给每个 Profile 写 soul.md
  7. 按 Profile 配 cron job
  8. 配 Kanban 做跨 Profile 任务跟踪
  9. 笔记本上装 Desktop app
  10. Desktop 通过 auth gate 连远端 backend
  11. 启用 config.yaml 里的 Tool Search
  12. 降 memory char 上限做 token 优化
  13. 用 Bitwarden Secrets Manager 管凭证
  14. 跑一周。Review skill、memory、token 用量
  15. 迭代。从此系统开始复利

如果觉得压不住,优先级顺序:从 cron job(10 招文里的 #3)、/goal 结构(#4)、skill(#8)入手——这三件事一夜之间改变 Hermes 的"手感"。

结语

Hermes Agent 是当前开源 agent 框架里"想突破会话和工具调用接口"这件事最有架构野心的尝试之一。持久记忆、Profile 隔离、Kanban 结构化任务编排、自然语言 cron、持久 /goal、动态 tool 加载、多平台 gateway、语音、生产级安全原语、创建可复用 procedure 的机制——这些组合起来让它比当下多数系统更接近"个人操作系统"这个概念

Nous Research 训练第一代 Hermes 模型的 Karan 描述得很简单:

"Hermes Agent 是拿一个语言模型,意识到你电脑上发生的一切都是 text in 或 text out。Hermes Agent 让你能用你电脑上所有 integrations 做这件事。它能用你的 browser、你的 app、你在电脑上做的所有事。它是电脑动作和数字动作的通用自动化器、通用模拟器。"

同时保持现实的预期很重要。Hermes 还没到成熟个人 AI OS。架构方向 promising,但真实有效性仍严重依赖仔细的配置、持续管理、对功能成熟度的诚实评估。

当用心当作基础设施用时,Hermes 能成为构建长期、演化、AI 辅助 workflow 的地基——这些 workflow 的能力会随时间复利。真正的差别在于"多有意地理解和使用系统的能力与限制"。

The agent is ready. The stack is ready. The value compounds with use.