返回 FEED
AGENT2026-06-08

Hermes Agent 怎么配模型:不是选最强,是搭一个能跑几个小时不心痛的栈

Hermes Agent 怎么配模型:不是选最强,是搭一个能跑几个小时不心痛的栈

如果给 Hermes 配模型和给普通聊天机器人配模型一样,那才奇怪。

聊天机器人用一个干净答案就能判。

Hermes 不是这样。Hermes 坐在你 terminal、Telegram、文件、repo、cron job、memory、skill、工具里。模型要撑得住长 loop、调得动工具、读得动脏 context、坏假设能 recover、烧钱还得有节制。

所以"Hermes 的最佳模型"不一定等于榜单上最聪明的那个。

它是"你敢让它跑几个小时不犹豫、推理质量又够放心让它碰文件系统"的那个

下面是 zaimiri 自己真在用的模型栈。

为什么选型要先排掉"心理成本"

zaimiri 把"Codex OAuth 订阅路径"列为大多数人的首选,不是 benchmark 最高,是它改变了用 agent 的心理学

普通按 token 计费:每开一个长 session 后脑里就有小计程表在跳。开新一轮检查——犹豫。放它多看几个文件——犹豫。让子 agent 跑——犹豫。

这对 agent 工作是毒药

agent 之所以变强,是因为你让它用 context、retry、verify、keep going。如果你每个 token 都在掂量,Hermes 就被你用成了"带 shell 的聊天窗"。

订阅制是让"该再问一轮吗"这个问题消失

Hermes 把 OpenAI Codex 作为一等 provider,通过 device-code OAuth 接入。setup 时开 URL、输 code,Hermes 存进自己的 auth store。Codex CLI 凭证也可以 import,不强求装 CLI。

适用场景:日常 Hermes、coding session、repo 编辑、terminal 任务、长 agent loop、"请检视这个并修一下"工作、不想立刻被按 token 计费劝退的初学者。

Caveat:实际访问和限额由 OpenAI/Codex 套餐决定。

Setup:

hermes model

选 OpenAI Codex。或:

hermes auth add codex-oauth

为什么它赢:让 Hermes 心理成本低到你能按 agent 该被用的方式用。这比 benchmark 多一分少一分重要

高代价任务:Claude Sonnet 4.6

如果任务失败成本高,zaimiri 仍然把 Claude Sonnet 顶在栈上。

Claude 在 agent 工作的"无聊部分"很强:读指令、尊重 plan、注意 edge case、在文件面前不耍小聪明。这比很多人以为的更重要

Hermes 可以直连 Anthropic,也可以经 OpenRouter 路由。原生 Anthropic 走 API key,Hermes 还有 Anthropic OAuth 路径绑定 Claude Max 并带额外 usage credits。

适用场景:复杂代码改动、refactor、debug、规划型任务、review 其它 agent 的产出、家族办公室/行政类任务(语气和谨慎度都关键)、"差不多就行"还不够的场合。

Caveat:Claude 通常不是便宜的日常锤。如果 Hermes 整天跑,让 Claude 干每件小事不划算。让它出场于"质量关键",或作为便宜模型做完一稿后的 review。

Setup(API key):

hermes chat --provider anthropic --model claude-sonnet-4-6

Permanent config:

model:
  provider: "anthropic"
  default: "claude-sonnet-4-6"

zaimiri 的判断:当 Hermes 需要 judgment 而不是输出时,Claude 是他信任的那个。

长上下文黄金搭档:Gemini Pro + Flash

Gemini 在 Hermes 栈里该有一席之地,因为 context 是这场游戏的一半。

真实 Hermes 任务很少是"回答这个问题",更像:

  • 读这个 repo
  • 对照这几份文档
  • 摘要这些 log
  • 翻这个 vault
  • 解释改了什么
  • 找出我忘掉的那件

这就是 Gemini Pro 的甜区——长上下文阅读和宽文档分析。

Gemini Flash 是另一面。便宜、快的辅助模型,专门做你不想每次都发到贵主模型的事。

Hermes 接 Google/Gemini 走 API key,也有 Google Gemini OAuth 路径。

Gemini Pro 适用:长文档、repo 理解、研究压缩、大 context 对比、"读完这些告诉我重点"工作。

Gemini Flash 适用:摘要、辅助任务、便宜路由、快低风险 pass。

Setup(API key):

hermes chat --provider gemini --model gemini-2.5-pro

hermes model 选 Google Gemini / Google Gemini OAuth。

Caveat:zaimiri 不总把 Gemini 当 tool-heavy coding loop 的主脑。取决于任务。读巨大 context 它一流;做细致多步编辑他仍然首选 Codex 或 Claude。

日常 worker:DeepSeek

DeepSeek 是想"让 Hermes 经常跑、又不想每件事都贵"时该看的那一个。

这件事比模型榜单争吵更重要

如果 Hermes 进了你日常,你会开始用它做小事:

  • 整理这个文件夹
  • 检视这条 traceback
  • 写个小脚本
  • 翻这些 log
  • 做个快比较
  • 跑一遍例行研究
  • 让一个子 agent 单独看这件事

这些加起来很可观。

一个便宜又能打的模型让你更随意地用 Hermes。这是巨大的优势

Hermes 直连 DeepSeek 走 DEEPSEEK_API_KEY,也走 OpenRouter 访问 DeepSeek 模型。

适用场景:高量工作、例行 coding、子 agent、批量任务、技术计划初稿、便宜检视 pass。

Setup:

hermes chat --provider deepseek --model deepseek-chat

或走 OpenRouter 统一计费。

Caveat 是信任:让 DeepSeek 做大量 first-pass 工作可以,但重要 edit 仍要 verify。终稿 plan 或 diff 经常还要过一遍 Claude/Codex 再 merge。

DeepSeek 是那个"让 Hermes 便宜到能持续用"的选项。

已在 xAI 生态:Grok

Grok 在 Hermes 里值得一说,因为 Hermes 现在通过 API key 和 OAuth(SuperGrok 风格账号)两条路径接 xAI。

精神上像 Codex setup:你已经在付订阅,开新 API 计费账户的摩擦就免了。

Hermes 也支持 xAI Responses API(带 provider 层 conversation-style caching)。多 turn agent session 的 caching 和连续性都靠这个。

适用场景:已经在付 Grok/SuperGrok 的用户、长 context 通用工作、X / 实时互联网相邻研究、订阅访问是核心动机的随意 Hermes 使用、第二意见模型。

Setup(API key):

hermes chat --provider xai --model grok-4.3

OAuth:hermes auth add xai-oauth,或从 hermes model 选 xAI Grok OAuth。

Caveat:在它成为你栈里唯一模型之前,zaimiri 会在你真实任务上测一遍。coding 和 tool-heavy 工作,Codex 和 Claude 仍是他的更安全首选。

但如果你已经在付 Grok、又想让 Hermes 走那条订阅路径,这是个真选项。

编程向便宜替代:Qwen Coder

Qwen Coder 是"想要 coding 焦点模型、又不想默认去最贵 provider"时该试的那一个。

Hermes 接 Qwen 几条路,名字别混:

  • Qwen OAuth(走 consumer portal)
  • Alibaba DashScope API(走 alibaba
  • Alibaba Coding Plan(走 alibaba-coding-plan

别混——它们是不同 provider 路径和计费表面。

Qwen3 Coder 适用:code-heavy 工作、便宜 coding agent、repo 任务、function/tool-use 实验、子 agent 通道。

Setup 取决于路径。DashScope:

hermes chat --provider alibaba --model qwen3-coder-plus

Coding plan 路径:

hermes chat --provider alibaba-coding-plan --model qwen3-coder-plus

Caveat 和任何便宜 coding 模型一样:信任大 edit 之前要 verify。

zaimiri 喜欢把它当"大量 coding 尝试 + 一个更强模型 review 最终 patch"的候选。

一把钥匙多模型:OpenRouter

OpenRouter 不是一个模型。它是 zaimiri 想"在 Hermes 里试一堆模型、又不挨个配 provider"时用的路由层

有用是因为"今天最对的 Hermes 模型"取决于任务。

今天要 Claude 拿 judgment。明天要 Gemini 拿 context。后天要 DeepSeek 或 Qwen 拿成本。某天要同一 prompt 上跑三个模型比较。

OpenRouter 让这变简单。

适用场景:模型测试、一把钥匙 setup、fallback 模型、Claude/Gemini/DeepSeek/Qwen/Grok 同台比较、想先保留可选项再下注的初学者。

Setup:

hermes chat --provider openrouter --model anthropic/claude-sonnet-4.6

或:

model:
  provider: "openrouter"
  default: "anthropic/claude-sonnet-4.6"

Caveat:你加了一个聚合层在你和上游模型之间。定价、路由、可用性都会漂。

不过对测 Hermes 模型,OpenRouter 仍是最省力的路径之一。

入门者 all-in-one:Nous Portal

Nous Portal 是 Nous Research 官方的订阅网关,Hermes 文档把它描述为运行 Hermes Agent 的推荐方式。

卖点简单:一个 OAuth 登录可以覆盖一堆 frontier 模型,外加 Tool Gateway 功能(web search、browser automation、image generation、TTS 等),具体看订阅。

这是对入门者极友好的路径——因为 Hermes 不仅是模型封装器。一旦你开始用工具,就会意识到 setup 痛点一半不是"哪个 LLM?",而是"搜索/浏览器/图片/语音各要什么凭证?"

适用场景:最简 all-in-one setup、想少管几个 API key、Hermes 入门、tool-heavy workflow、一个 portal 试多模型家族。

Setup:

hermes setup --portal

hermes model 选 Nous Portal。

Caveat:zaimiri 仍会测你真用的那个模型在 coding 上的表现。Portal 方便不等于背后每个模型都是每个任务的最佳 agent 脑。

实际栈的样子

如果给一个普通 power user 配 Hermes,zaimiri 不会选一个模型然后宣布完事。

他会搭一个小栈:

  • 主日常 driver:OpenAI Codex OAuth(如果你套餐支持)
  • 高信任 review 模型:Claude Sonnet 4.6
  • 长上下文 reader:Gemini 2.5 Pro
  • 便宜 worker 模型:DeepSeek V3.2 或 Qwen3 Coder
  • 灵活测试层:OpenRouter
  • All-in-one 入门路径:Nous Portal
  • 可选订阅路径:xAI Grok OAuth(如果你已经在付)

这是想 Hermes 该有的方式。

Hermes 不是单一聊天窗。它是 OS 层。

一个真实 setup 看起来更像一条链:

  • Telegram 接 capture
  • Skills 装重复 workflow
  • Memory 存稳定偏好
  • Cron jobs 排定时检查
  • Subagents 做并行工作
  • Profiles 分隔身份
  • MCP 和 tools 接外部系统
  • 模型按 job 路由,不按 ego 选

偷懒版

  1. Codex OAuth 当默认
  2. 加 Claude 处理重要 review
  3. 要长 context 和模型可选项时,加 Gemini 或 OpenRouter
  4. Hermes 跑得频繁后,加一个便宜 worker 模型

这够让 Hermes 真正有用,又不至于把"选模型"变成一个爱好。

模型重要。

真正的优势是让 Hermes 便宜到、可靠到、contextual 到你真的每天都在用