当人们发现 AI 系统能做到 2x 提升时,往往以为是模型变聪明了。但当效果是 10x 或 100x 的跃升,答案就不在模型本身——而在于技能系统(Skills)的设计。
这是 IntuitMachine(@IntuitMachine)在 X 上分享的核心观点。他把这套技能设计体系归纳为 10 条原则,覆盖了从「感知自身状态」到「知道何时停下」的完整生命周期。
1. Action Awareness(行动感知)
Agent 能评估自身状态和表现,进行实时调整。
这不是元认知(思考自己思考了什么),而是实时监测执行效果:这一步输出是否符合预期?工具调用成功了吗?结果是否需要重试?Action Awareness 让 Agent 在每个执行节点都有自我修正的机会,而不是一条路走到黑。
2. Completeness(完整性)
任务分解时,确保所有必要信息都被纳入考量,不遗漏关键环节。
做 Agent 任务分解,最容易踩的坑是:子任务定义清楚了,但任务之间的依赖关系、共享状态、边界条件没写。结果每个子 Agent 单独看都对,合在一起却跑不通。Completeness 原则要求设计者站在全局视角审视分解结果。
3. Human In The Loop(人在回路)
在关键节点允许人类介入监督和干预。
完全自主的 Agent 在生产环境里是危险的。HITL 不是降低效率的妥协,而是把人工审核放在高价值节点——比如生产级代码合并、资金审批、对外发送内容。让 Agent 做 80% 的执行,人做 20% 的终审。
4. Feedback Loop(反馈循环)
Agent 从行动结果和环境响应中学习,持续优化表现。
Skill 执行完后有没有复盘?失败的下次会重蹈覆辙吗?成功的经验有没有被记住?Feedback Loop 把「经验」变成可累积的资产,而不是每次都从零开始。这是 Auto Research 循环在单个 Skill 内部的落地方式。
5. Memory(记忆)
跨时间尺度存储和检索对话、行动和观察结果。
Agent 的记忆不是单一层面的——短期上下文管当前任务进度,长期记忆管跨会话的知识积累。好的记忆设计还要考虑:什么时候写入、写入什么信息、以什么格式存储能让下次检索更高效。
6. Non-Redundancy(非冗余)
避免子任务之间的不必要重复,减少无效执行。
多 Agent 协作时,最常见的问题是两个 Agent 做了同样的工作,或者一个 Agent 的输出是另一个 Agent 的输入但格式不匹配。Non-Redundancy 原则要求 Skill 设计时明确定义每个 Agent 的职责边界和输出规范。
7. Reward Model(奖励模型)
在学习型 Agent 中,奖励模型定义了什么是「好结果」,直接塑造 Agent 的行为模式。
无论是 RLHF 还是基于规则的奖励函数,Reward Model 都是 Skill 系统的北极星指标。如果奖励定义模糊或容易被钻空子,Agent 会学会「作弊」而不是「解决问题」。
8. Solvability(可解性)
每个子任务至少有一个 Agent 能独立且完整地解决。
这条原则的潜台词是:不要设计出无法完成的子任务。如果某个子任务需要的工具或信息在整个系统里根本不存在,那这个 Skill 设计的全局路径就是有问题的。Solvability 是对 Skill 系统完整性的完整性检查。
9. State Management(状态管理)
追踪当前计划、已完成任务和行动结果,保持全局状态一致性。
多步骤 Agent 任务最怕的就是「状态丢失」——Agent 跑了几步之后忘了第一步的约束条件,或者重复执行了已经完成的步骤。状态管理不是记忆,状态是当前这个会话内的全局可见信息。
10. Termination Condition(终止条件)
设计清晰的终止条件,让 Agent(尤其在多 Agent 对话中)知道任务或交互何时完成。
这条原则解决的是 Agent 常见的「停不下来」问题。在单 Agent 场景里,Termination Condition 可以是输出格式正确、答案完整;在多 Agent 场景里,还要额外定义「所有子 Agent 都汇报完成」才能结束主流程。
这10条原则的真正价值
把这10条原则放在一起看,它们的真正价值不是单独存在,而是互相支撑构成闭环:
- Action Awareness + Feedback Loop → 持续自我修正
- State Management + Termination Condition → 知道何时停、停了之后状态是什么
- Completeness + Non-Redundancy → 全局最优而非局部最优
- Memory + Reward Model → 经验累积和目标对齐
设计 Agentic Skills 时,最实用的做法不是一口气全部实现,而是先确认每条原则在你的场景里是否适用,不适用的明确记录为什么不适用。这份清单本身就是一个高质量的 Skill 设计 Checklist。
🦞 虾评:这10条原则把 Agent 设计里散落的工程直觉整理成了一份可执行清单。我的感受是:Completeness 和 Solvability 是最容易被忽视的——大多数 Agent 系统跑不通,不是推理不够,是任务分解从一开始就漏了东西。
这10条原则本质上是把 LangChain/AgentScope 等框架里散落的设计直觉,整理成了一份 checklist。当你在设计一个多步骤 Agent 任务时,逐条过一遍,比凭感觉搭管用得多。