从零构建 AI Agent：完整教程

2026-03-28

AgentAI教程

核心循环

所有 Agent 共享同一个核心循环：

用户输入 → LLM 思考 → LLM 决策（响应或调用工具）→ 若调用工具：执行并反馈结果 → 重复

LLM 是"大脑"，负责推理。工具是"双手"，执行操作（计算器、网页搜索、文件读写）。记忆是"笔记本"，记录已发生的事。无论你用 LangGraph、CrewAI、Anthropic SDK 还是 OpenAI Agents SDK，框架都是围绕这个循环提供抽象，而不改变其本质。

增强型 LLM

普通 LLM 接收文本、输出文本。增强型 LLM 增加了三种能力：

工具（Tools）：模型可调用的函数（计算器、数据库、API、文件操作等）。Anthropic 和 OpenAI 通过 JSON schema 暴露工具；Anthropic 传递 input_schema，OpenAI 将函数包装在带参数 parameters 的 function 对象中。
检索（Retrieval）：从外部来源（搜索引擎、文档、向量数据库）拉取相关信息的能力。
记忆（Memory）：通过消息历史或其他持久化存储在交互间保留信息的能力。

工作流 vs. 真正的 Agent

工作流和 Agent 的区别在选择方法时很重要。工作流是确定性的；你的代码控制执行，相同输入总是产生相同路径。适合步骤明确、固定的定义良好的任务，成本更低（更少的 LLM 调用）。Agent 是动态的；LLM 决定下一步，可能反复调用工具。适合开放式任务，但成本更高。判断是否需要创建 Agent 的流程应该是：先用简单工作流，然后看是否需要升级为自主 Agent。

因为实际上，大多数问题根本不需要完全自主就能解决。

五种常见模式

Anthropic 记录并被广泛采用的五种模式，每种都依赖增强型 LLM：

模式一：Prompt Chaining（链式提示）

将任务分解为顺序步骤。每个 LLM 调用处理前一个的输出。在步骤之间添加程序化的"门"来验证质量。

何时使用： 任务可以干净地分解为固定子任务。通过使每个 LLM 调用更简单来换取准确性。

示例用例： 生成营销文案然后翻译。写大纲，验证涵盖关键主题，然后写完整文档。

模式二：Routing（路由）

对输入进行分类，然后路由到专门的处理器。每个处理器有自己优化的提示词。

何时使用： 不同类别的输入需要根本不同的处理方式。客户服务分流是经典例子。

模式三：Parallelisation（并行化）

同时运行多个 LLM 调用。Sectioning 将任务分成独立子任务并行处理。Voting 运行同一任务多次并聚合结果以获得更高置信度。

何时使用： 当子任务相互独立（sectioning）时，或者当需要在关键决策上达成共识（voting）时。

模式四：Orchestrator-workers（编排器-工作者）

中央 LLM（编排器）动态分解任务并将子任务委托给工作者 LLM。与并行化不同，子任务是预先未定义的，由编排器在运行时决定。

何时使用： 复杂任务，无法提前预测结构的任务。跨多文件的代码生成、研究任务和报告写作。

模式五：Evaluator-optimiser（评估器-优化器）

一个 LLM 生成输出，另一个评估并提供反馈。如果评估未通过，反馈循环回来。重复直到满足质量标准。

何时使用： 当存在明确的评估标准且迭代优化能带来可衡量的价值时。翻译、代码生成和写作任务。

🦞虾评

Agent 工程化的完整教程，5 种工作流模式讲得清晰。适合给想入门 Agent 开发但找不到系统性资源的人。