核心循环
所有 Agent 共享同一个核心循环:
用户输入 → LLM 思考 → LLM 决策(响应或调用工具)→ 若调用工具:执行并反馈结果 → 重复
LLM 是"大脑",负责推理。工具是"双手",执行操作(计算器、网页搜索、文件读写)。记忆是"笔记本",记录已发生的事。无论你用 LangGraph、CrewAI、Anthropic SDK 还是 OpenAI Agents SDK,框架都是围绕这个循环提供抽象,而不改变其本质。
增强型 LLM
普通 LLM 接收文本、输出文本。增强型 LLM 增加了三种能力:
- 工具(Tools):模型可调用的函数(计算器、数据库、API、文件操作等)。Anthropic 和 OpenAI 通过 JSON schema 暴露工具;Anthropic 传递
input_schema,OpenAI 将函数包装在带参数parameters的 function 对象中。 - 检索(Retrieval):从外部来源(搜索引擎、文档、向量数据库)拉取相关信息的能力。
- 记忆(Memory):通过消息历史或其他持久化存储在交互间保留信息的能力。
工作流 vs. 真正的 Agent
工作流和 Agent 的区别在选择方法时很重要。工作流是确定性的;你的代码控制执行,相同输入总是产生相同路径。适合步骤明确、固定的定义良好的任务,成本更低(更少的 LLM 调用)。Agent 是动态的;LLM 决定下一步,可能反复调用工具。适合开放式任务,但成本更高。判断是否需要创建 Agent 的流程应该是:先用简单工作流,然后看是否需要升级为自主 Agent。
因为实际上,大多数问题根本不需要完全自主就能解决。
五种常见模式
Anthropic 记录并被广泛采用的五种模式,每种都依赖增强型 LLM:
模式一:Prompt Chaining(链式提示)
将任务分解为顺序步骤。每个 LLM 调用处理前一个的输出。在步骤之间添加程序化的"门"来验证质量。
何时使用: 任务可以干净地分解为固定子任务。通过使每个 LLM 调用更简单来换取准确性。
示例用例: 生成营销文案然后翻译。写大纲,验证涵盖关键主题,然后写完整文档。
模式二:Routing(路由)
对输入进行分类,然后路由到专门的处理器。每个处理器有自己优化的提示词。
何时使用: 不同类别的输入需要根本不同的处理方式。客户服务分流是经典例子。
模式三:Parallelisation(并行化)
同时运行多个 LLM 调用。Sectioning 将任务分成独立子任务并行处理。Voting 运行同一任务多次并聚合结果以获得更高置信度。
何时使用: 当子任务相互独立(sectioning)时,或者当需要在关键决策上达成共识(voting)时。
模式四:Orchestrator-workers(编排器-工作者)
中央 LLM(编排器)动态分解任务并将子任务委托给工作者 LLM。与并行化不同,子任务是预先未定义的,由编排器在运行时决定。
何时使用: 复杂任务,无法提前预测结构的任务。跨多文件的代码生成、研究任务和报告写作。
模式五:Evaluator-optimiser(评估器-优化器)
一个 LLM 生成输出,另一个评估并提供反馈。如果评估未通过,反馈循环回来。重复直到满足质量标准。
何时使用: 当存在明确的评估标准且迭代优化能带来可衡量的价值时。翻译、代码生成和写作任务。
Agent 工程化的完整教程,5 种工作流模式讲得清晰。适合给想入门 Agent 开发但找不到系统性资源的人。