大多数人构建一个 AI Agent,看着它在复杂任务上失败,然后得出结论 AI Agent 还没准备好。真正的问题是架构。
这个完整课程展示了构建多 Agent 系统的精确心智模型、团队结构、工具和生产模式,以产生可靠、高质量的输出。
核心思维转变
按任务思考,而不是按角色思考
构建多 Agent 系统时最常见的错误是复制人类组织架构。你创建一个"研究 Agent"、一个"写作 Agent"和一个"营销 Agent"——然后奇怪为什么输出不一致且难以调试。
改变一切的转变:按任务思考,而不是按角色思考。
AI Agent 在有一个明确目标、有限工具和精确指令的单一离散任务上表现最佳。一个职责广泛的 Agent 做出模糊的决定。一个任务狭窄的 Agent 产生一致、可靠的输出。
不是"内容 Agent",而是构建:
- 研究任务 Agent —— 接收主题,返回结构化研究笔记
- 简报撰写 Agent —— 接收研究笔记,返回内容简报
- 草稿撰写 Agent —— 接收简报,返回完整草稿
- 编辑 Agent —— 接收草稿,返回编辑版本和批评
- 发布 Agent —— 接收最终副本,格式化并发布
每个 Agent 都简单、可测试、可替换。整个系统很强大。
MIT 和 Google Brain 的研究发现,当 Agent 辩论和批评彼此的输出时,推理质量和事实准确性都显著提高——即使一个 Agent 从错误答案开始,其他 Agent 的批评也会纠正轨迹。
四种核心 Agent 角色
每个有效的多 Agent 团队都有四种功能类别的 Agent。你不需要每个类别一个 Agent,但每个生产团队都需要覆盖所有四个功能。
1. 协调者(Orchestrator)
协调者接收顶级任务,将其分解为子任务,分配给正确的专业 Agent,收集输出,并综合最终结果。它从不做实际工作,只协调。
2. 研究者
研究者的唯一工作是查找、检索和结构化信息。它不写作、不分析、不创造——它收集。
3. 专业生产者
这些是工人,每个生产任务一个 Agent。常见的专业 Agent 包括:
- 写作 Agent:接收简报,撰写草稿
- 编码 Agent:接收需求,编写代码
- 数据分析师 Agent:接收原始数据,返回洞察
- 设计简报 Agent:接收概念,返回视觉设计简报
- 外联 Agent:接收潜在客户数据,撰写个性化消息
4. 批评者/审阅者
这是大多数 Agent 系统中最被忽视的角色——也是对质量最重要的角色。批评者接收任何 Agent 的输出,根据定义的标准评估它,并返回具体的、可操作的反馈。
一个设计良好的批评者不会说"这很糟糕"。它会说:
- "引言把主要主张埋在第三段。把它移到第一句。"
- "第二段的主张没有根据。添加来源或删除它。"
- "语气不一致——第 1-3 段是正式的,第 4-6 段是随意的。统一。"
批评者 Agent 是将产生平庸输出的多 Agent 系统与产生你自豪地发布的工作的系统区分开来的东西。
三种架构
架构 1:顺序(流水线)
Agent 一个接一个地运行。Agent A 的输出成为 Agent B 的输入。
输入 → 研究 Agent → 简报 Agent → 写作 Agent → 编辑 Agent → 输出
适用于:任务有清晰的线性流程。每个步骤依赖于前一个正确完成。
架构 2:并行(扇出)
协调者将任务拆分并同时发送给多个 Agent。所有 Agent 同时工作。协调者收集并综合结果。
适用于:任务可以划分为独立的并行工作流。显著减少总运行时间。
架构 3:分层(多层)
多层协调。顶级协调者管理中级协调者,每个中级协调者管理专业 Agent。
适用于:任务足够复杂,需要协调多个流水线,而不仅仅是多个 Agent。
工具栈
无代码/低代码(从这里开始)
- Make(以前叫 Integromat):多 Agent 工作流的最佳可视化构建器
- n8n:Make 的开源替代品,可自托管
- Relevance AI:专门为多 Agent 系统构建
基于代码的框架(用于完全控制)
- Claude API with tool use:直接用 Anthropic Claude API 构建 Agent
- LangGraph:基于图的框架,节点是 Agent,边定义交接
- Agno(以前叫 Phidata):专门设计用于构建具有分层协调的 Agent 团队
- AutoGen(Microsoft):多 Agent 对话框架
五个可靠模式
模式 1:强制执行结构化输出
团队中的每个 Agent 都应该以定义的格式返回输出——不是自由形式的散文。这使交接可靠。
模式 2:Agent 之间的质量门
不要自动将每个输出传递给下一个 Agent。添加一个简单的评估步骤——协调者审查或专门的批评 Agent——在输出进入下游之前检查它。
模式 3:给 Agent 最小工具集
一个有 15 个工具的 Agent 会不一致地使用它们。一个有 2-3 个工具的 Agent 会可靠地使用它们。
模式 4:构建重试循环
每个生产 Agent 团队都需要重试机制。当 Agent 的输出未通过质量门时,它应该获得第二次机会,并带有具体反馈。
模式 5:记录一切
在生产中,每个 Agent 调用都应该记录:它接收的输入、它产生的输出、它调用的工具以及花费的时间。
快速启动:48 小时内构建你的第一个 Agent 团队
- 第 1 小时:挑选你业务中一个需要三个或更多步骤的工作流,每个步骤都可以由不同的人完成。
- 第 2 小时:为每个步骤编写系统提示,就像你在向新员工介绍一样:这是你的一个工作,这是你接收的,这是你确切必须返回的。
- 第 3 小时:在 Make 或 n8n 中构建流水线。按顺序连接 Agent。
- 第 4-6 小时:运行五个测试用例。找到流水线中断的地方。收紧最弱的提示。
- 第 2 天:在最重要的步骤之后添加批评 Agent。再运行五个测试。比较输出质量。
- 第 2 天晚上:把它放在真实任务面前。审查输出。迭代。
一个 Agent 运行一个任务。一个 Agent 团队运行一个业务。