AI Agent 框架、多 Agent 编排、Agentic Loop、工具调用、子 Agent 协调……听起来复杂得像需要计算机学位加三年后端经验才能入门。
其实不需要。这篇指南的目标是:一个周末,构建出你第一个真正能跑的 AI Agent。不是聊天机器人,不是一次性自动化,是一个能设定目标、拆解步骤、使用工具、直至交付结果的真实 Agent。
Agent 是什么
忘掉所有复杂的定义。
聊天机器人等你提问 → 给出回答 → 停下。Agent 拿到目标,决定需要哪些步骤,用工具完成这些步骤,持续运作直到目标达成。
区别就一个字:自主性。
一个真实场景的对比:
- 聊天机器人:你问"阿姆斯特丹天气如何",它回答"目前 12 度,多云"
- Agent:你说"我明天有户外会议,要不要带伞",Agent 查天气预报、查你所在位置、查明天逐小时降水预报、查会议时间段,综合判断后回答:"下午 2 点到 4 点有雨,带伞;建议考虑改到室内,因为有 70% 概率下大雨"
Agent 没有回答一个问题,而是理解了一个目标(帮我准备会议),找出所需信息(天气预报、时机),用了工具(天气 API),给出了可操作的建议。
准备工作
- Anthropic API Key:去 console.anthropic.com 创建账户、添加计费、获取 Key。个人项目周末练习花不了几美元。
- Python:去 python.org 下载最新版。Mac 打开 Terminal,Windows 打开 Command Prompt 或 PowerShell,输入
python --version确认安装成功。
建项目目录并安装依赖:
mkdir my-first-agent
cd my-first-agent
python -m venv venv
source venv/bin/activate # Windows 用 venv\Scripts\activate
pip install anthropic
Agentic Loop:核心概念就这一个
每个 Agent 都遵循同一个基础循环:
- 把目标 + 可用工具描述发给 Claude
- Claude 决定是否需要用工具达成目标
- 如果需要,Claude 告诉你调用哪个工具、输入什么
- 代码执行工具,把结果返回给 Claude
- Claude 决定是否还需要其他工具,或目标已达成
- 重复直到完成
这就是全部概念。其他都是细节。
第一步:让 Claude 帮你写代码
创建一个空文件 agent.py,然后直接打开 Claude(或任何支持 Claude API 的界面),把这个 Prompt 丢进去:
I want to build my first AI agent in Python using the Anthropic API.
The agent should:
1. Accept a goal from the user
2. Have access to 2 tools: a web search tool (simulated with a function that returns mock data) and a calculator tool
3. Use the standard agentic loop: send message → check if Claude wants to use a tool → execute the tool → send result back → repeat until done
4. Print each step so I can see the agent thinking
Requirements:
- Use the Anthropic Python SDK
- Use claude-sonnet-4-20250514 as the model
- The agent should loop properly using stop_reason to detect when Claude is done
- Include clear comments explaining every section
- Keep it simple — this is my first agent ever
Write the complete code I can save as agent.py and run.
Claude 会生成完整可运行的脚本。保存为 agent.py,设置 API Key 环境变量,然后运行:
export ANTHROPIC_API_KEY=your-key-here
python agent.py
给一个简单目标试试,比如:"15% 的 847 是多少,这是正常的小费比例吗?"
你会看到 Agent 思考这个问题、决定用计算器、得到结果、判断这是否正常小费、给出最终回答。这是你第一个 Agent——一个能推理、会用工具、向目标迭代的系统。
接入真实工具
模拟工具只是概念验证。现在接入真实数据。
让 Claude 修改你的 Agent,接入 Tavily 搜索 API(有慷慨的免费额度),替换掉模拟搜索函数。当 Agent 再次跑起来、问它需要实时信息的问题,它会真正搜索网络、处理结果、融入推理。
这是它从玩具变成实用工具的临界点。
再加一个文件读取工具:让 Agent 能读你电脑上指定文件夹里的文件内容。问它"读一下我昨天的笔记,提取关键事项",它会打开文件、读取内容、生成摘要。
两个真实工具——搜索和文件读取——已经让 Agent 能处理真实任务:研究一个主题然后把发现写入文件,指向一个文档让它分析内容。
对话记忆
当前 Agent 每次处理一个目标。让它记住完整对话历史:每次交互后保留完整消息历史,和下一次请求一起发送。Agent 会记住你们讨论过什么、在哪个话题上继续,而不需要你重新解释。
这是从一次性工具到助手的关键转变。
错误处理
真实工具会失败——API 超时、文件不存在、数据格式错误。
给每个工具加上结构化错误处理:告诉 Agent 哪里出了问题、下一步怎么办。好的错误处理是 demo 和日常可用工具的分界线。
毕业设计
给 Agent 十个不同难度的任务,观察它的表现:
- "这周天气预报是什么?"
- "读我的会议笔记,提取行动项"
- "研究 [主题] 最新新闻,写一段总结"
- "计算 10000 美元年利率 5% 复利 10 年的结果"
- "找出阿姆斯特丹三家好评餐厅并比较"
每个任务暴露一个改进点:更好的工具描述、更好的错误处理、新的工具。
三阶段进阶路径
第二周:根据实际需要加 3-5 个工具。天气、日历、邮件、文件创建、数据分析——匹配你的工作流。
第三周:把 Agent 部署到能持续运行的地方。树莓派、低配云服务器,或者你的笔记本。接入 Telegram 或 WhatsApp,手机上随时对话。
第二个月:研究多 Agent 架构。构建多个专业 Agent 协同工作的系统——一个做研究,一个写内容,一个做数据分析,由一个中央 Agent 协调。
第三个月:开始为别人建 Agent。你这个周末学到的技能,企业会为此付费。能够构建定制 AI Agent 的人才市场正在快速增长,供给远没跟上需求。
这篇文章的核心价值不是技术细节,而是一个认知框架:Agent 的本质是"自主循环"而不是"回答问题"。对于零基础读者来说,真正重要的不是学会用 Claude API——是用一个周末的时间建立对 Agent 工作方式的直觉,这种直觉比任何具体工具都有长期价值。入门门槛已经低到 Python + API Key,缺的只是"动手做一个"的第一步。