如何构建真正协作的 AI Agent 团队（完整课程）

大多数人构建一个 AI Agent，看着它在复杂任务上失败，然后得出结论 AI Agent 还没准备好。真正的问题是架构。

这个完整课程展示了构建多 Agent 系统的精确心智模型、团队结构、工具和生产模式，以产生可靠、高质量的输出。

核心思维转变

按任务思考，而不是按角色思考

构建多 Agent 系统时最常见的错误是复制人类组织架构。你创建一个"研究 Agent"、一个"写作 Agent"和一个"营销 Agent"——然后奇怪为什么输出不一致且难以调试。

改变一切的转变：按任务思考，而不是按角色思考。

AI Agent 在有一个明确目标、有限工具和精确指令的单一离散任务上表现最佳。一个职责广泛的 Agent 做出模糊的决定。一个任务狭窄的 Agent 产生一致、可靠的输出。

不是"内容 Agent"，而是构建：

研究任务 Agent —— 接收主题，返回结构化研究笔记
简报撰写 Agent —— 接收研究笔记，返回内容简报
草稿撰写 Agent —— 接收简报，返回完整草稿
编辑 Agent —— 接收草稿，返回编辑版本和批评
发布 Agent —— 接收最终副本，格式化并发布

每个 Agent 都简单、可测试、可替换。整个系统很强大。

MIT 和 Google Brain 的研究发现，当 Agent 辩论和批评彼此的输出时，推理质量和事实准确性都显著提高——即使一个 Agent 从错误答案开始，其他 Agent 的批评也会纠正轨迹。

四种核心 Agent 角色

每个有效的多 Agent 团队都有四种功能类别的 Agent。你不需要每个类别一个 Agent，但每个生产团队都需要覆盖所有四个功能。

1. 协调者（Orchestrator）

协调者接收顶级任务，将其分解为子任务，分配给正确的专业 Agent，收集输出，并综合最终结果。它从不做实际工作，只协调。

2. 研究者

研究者的唯一工作是查找、检索和结构化信息。它不写作、不分析、不创造——它收集。

3. 专业生产者

这些是工人，每个生产任务一个 Agent。常见的专业 Agent 包括：

写作 Agent：接收简报，撰写草稿
编码 Agent：接收需求，编写代码
数据分析师 Agent：接收原始数据，返回洞察
设计简报 Agent：接收概念，返回视觉设计简报
外联 Agent：接收潜在客户数据，撰写个性化消息

4. 批评者/审阅者

这是大多数 Agent 系统中最被忽视的角色——也是对质量最重要的角色。批评者接收任何 Agent 的输出，根据定义的标准评估它，并返回具体的、可操作的反馈。

一个设计良好的批评者不会说"这很糟糕"。它会说：

"引言把主要主张埋在第三段。把它移到第一句。"
"第二段的主张没有根据。添加来源或删除它。"
"语气不一致——第 1-3 段是正式的，第 4-6 段是随意的。统一。"

批评者 Agent 是将产生平庸输出的多 Agent 系统与产生你自豪地发布的工作的系统区分开来的东西。

三种架构

架构 1：顺序（流水线）

Agent 一个接一个地运行。Agent A 的输出成为 Agent B 的输入。

输入 → 研究 Agent → 简报 Agent → 写作 Agent → 编辑 Agent → 输出

适用于：任务有清晰的线性流程。每个步骤依赖于前一个正确完成。

架构 2：并行（扇出）

协调者将任务拆分并同时发送给多个 Agent。所有 Agent 同时工作。协调者收集并综合结果。

适用于：任务可以划分为独立的并行工作流。显著减少总运行时间。

架构 3：分层（多层）

多层协调。顶级协调者管理中级协调者，每个中级协调者管理专业 Agent。

适用于：任务足够复杂，需要协调多个流水线，而不仅仅是多个 Agent。

工具栈

无代码/低代码（从这里开始）

Make（以前叫 Integromat）：多 Agent 工作流的最佳可视化构建器
n8n：Make 的开源替代品，可自托管
Relevance AI：专门为多 Agent 系统构建

基于代码的框架（用于完全控制）

Claude API with tool use：直接用 Anthropic Claude API 构建 Agent
LangGraph：基于图的框架，节点是 Agent，边定义交接
Agno（以前叫 Phidata）：专门设计用于构建具有分层协调的 Agent 团队
AutoGen（Microsoft）：多 Agent 对话框架

五个可靠模式

模式 1：强制执行结构化输出

团队中的每个 Agent 都应该以定义的格式返回输出——不是自由形式的散文。这使交接可靠。

模式 2：Agent 之间的质量门

不要自动将每个输出传递给下一个 Agent。添加一个简单的评估步骤——协调者审查或专门的批评 Agent——在输出进入下游之前检查它。

模式 3：给 Agent 最小工具集

一个有 15 个工具的 Agent 会不一致地使用它们。一个有 2-3 个工具的 Agent 会可靠地使用它们。

模式 4：构建重试循环

每个生产 Agent 团队都需要重试机制。当 Agent 的输出未通过质量门时，它应该获得第二次机会，并带有具体反馈。

模式 5：记录一切

在生产中，每个 Agent 调用都应该记录：它接收的输入、它产生的输出、它调用的工具以及花费的时间。

快速启动：48 小时内构建你的第一个 Agent 团队

第 1 小时：挑选你业务中一个需要三个或更多步骤的工作流，每个步骤都可以由不同的人完成。
第 2 小时：为每个步骤编写系统提示，就像你在向新员工介绍一样：这是你的一个工作，这是你接收的，这是你确切必须返回的。
第 3 小时：在 Make 或 n8n 中构建流水线。按顺序连接 Agent。
第 4-6 小时：运行五个测试用例。找到流水线中断的地方。收紧最弱的提示。
第 2 天：在最重要的步骤之后添加批评 Agent。再运行五个测试。比较输出质量。
第 2 天晚上：把它放在真实任务面前。审查输出。迭代。

一个 Agent 运行一个任务。一个 Agent 团队运行一个业务。