一个 CTO 做了 3 周对比测试,最后决定从 OpenClaw 迁移到 Hermes。这是一个真实用户的对比复盘,不是厂商宣传材料。

OpenClaw 的三个根本问题

静态 Skills 是瓶颈。OpenClaw 的 Skills 是需要人工定义的——当一个新模式出现,Agent 不会自动适应,必须有人回去写一个新的 Skill 定义。比如 CTO 的 OpenClaw 能拉 TikTok 数据做分析,但当创作者开始用一种新格式发帖时,Agent 不会自动学会判断什么是有效的新格式。需要 CTO 手动介入去定义这个 Skill——这个过程本身就是瓶颈。

安全问题被忽视。安全研究者发现了 13.5 万个 OpenClaw 实例暴露在公网上,分布在 82 个国家。部分 Skills 被设计成在用户不知情的情况下窃取 API 密钥。这不是说不能用 OpenClaw,而是说必须了解你在部署什么,并加上认证保护。

记忆只存不连。OpenClaw 有持久化记忆,但只是记住事实,无法建立联系。三周之后,它会忘记当初为什么做了某个决定、结果是什么、以及这个决定应该怎么影响下一次行动。记忆是碎片化的,没有形成上下文链条。

Hermes 的核心差异:自进化循环

用了 Hermes 两周后,它开始处理没有被显式教过的模式。

它观察 CTO 给工单分类,然后自己建了一个 Skill,并持续优化这个 Skill。OpenClaw 需要 CTO 手动做的事,Hermes 自己学会了。关键的区别是:当 Hermes 解决了一个难题,它会写一份可重用的 Markdown Skill 文档,以便未来遇到类似问题时更容易解决。这个动作会叠加,价值随时间增长。

三层记忆系统

Hermes 的记忆是分层的:

会话记忆处理当前对话。持久记忆跨会话记住事实和偏好。Skill 记忆记录 Agent 在所有会话中学到的解决方案模式。

实际效果是:Agent 能回忆起 4 周前的对话,然后搜索自己的历史记录,为当前业务决策添加上下文。这解决的是 OpenClaw "记住但不连接"的问题。

安全警告仍然适用

13.5 万个 OpenClaw 实例暴露在公网上这个数字本身说明问题。部署任何 Agent 系统到公网都需要加上认证层,不只是 OpenClaw。这对整个领域都是提醒。

如何看待这个对比

这是 CTO 个人的 3 周测试,不是系统性评测。Hermes 的 22k GitHub stars(2026 年 2 月发布)是背景数据,但 Stars 高不代表适合你的场景。真正值得注意的不是哪个更好,而是 OpenClaw 的 Skills 瓶颈和记忆问题确实是很多用户在反馈的真实痛点。