Anthropic 推出 Claude Managed Agents——一个预构建、可配置的 Agent 工具链,直接运行在托管基础设施上。你只需要定义 Agent 模板(工具、Skills、文件/仓库),系统自动处理工具调用路由、上下文管理和长期任务的基础设施保障。
为什么需要 Managed Agents
当前基于 Messages API 构建 Agent 的方式有一个根本问题:工具链(harness)本质上是对模型能力的假设集合。随着 Claude 能力快速迭代,这些假设会迅速过时。每次模型更新,工具链都需要重新适配。
同时,Claude 的单次运行时间已经在 METR 基准测试中超过了 10 人时。这对基础设施提出了硬要求:任务要能跨小时、天、月稳定运行,中途断电要能恢复,多 Agent 协作要能水平扩展。
Claude Managed Agents 的思路是:不再让工具链追赶模型能力,而是把基础设施本身做成可独立演进的接口。
三个核心概念
Agent 是版本化的配置单元:模型选择、系统提示词、可用工具列表、Skills、MCP 服务器——全部打包在一起,一次创建,多次引用。
Environment 是沙箱模板:定义运行时类型(Node.js / Python 等)、网络隔离策略、依赖包配置。每次启动 Session 时,从这个模板出发创建隔离的执行环境。
Session 是有状态的执行实例:基于某个 Agent 配置和某个 Environment 模板创建,系统分配一个 fresh 的沙箱,挂载本次运行需要的文件或 GitHub 仓库,MCP 凭证存在安全 vault 里。一个 Agent 可以有多个并发 Session。
三个概念的解耦意味着:替换底层沙箱技术不需要重写 Agent 配置,更换模型不需要重构基础设施,Session 日志独立于工具链本身——每次改动都可以独立验证。
典型用法
事件触发:监控系统发现 bug,自动触发 Managed Agent 写 patch 并提交 PR,全程无人参与。
定时任务:每天定时跑一次简报——抓取 X 动态、汇总团队 GitHub 活动、整理成文档发回。
人触发后执行:通过 Slack 或 Teams 向 Agent 派发任务,说清楚要什么,Agent 在后台完成,直接交付成品(表格、幻灯片、应用)。
长时任务:这是最有战略价值的场景。Anthropic 认为未来 Claude 会连续运行在天、周、月的尺度上处理人类最复杂的挑战,Managed Agents 为此设计了一整套基础设施。
架构设计思路
传统的 Agent 系统把"大脑"(模型 + 工具链)、"手"(执行工具和沙箱)、"会话记录"紧耦合在一起。任何一个模块的升级都可能牵扯到其他模块。
Claude Managed Agents 的做法是让这三者都成为独立接口,每个接口对其他两者只有最少假设——任何一个模块都可以独立失效或被替换,而不影响整体稳定性。
起步方法
在 Claude Code 里直接跑:
(claude-api managed-agents-onboarding)
也可以用 SDK(Python / TypeScript / Java / Go / Ruby / PHP)或 CLI 管理所有资源(Agent、Environment、Session、Vault、Skills、文件)。
Anthropic 的做法本质上是把 Agent 系统做成了云服务——用户买的是"免维护的工具链基础设施",自己只关心业务逻辑层的 Agent 配置。这是模型厂商做 Agent 的天然优势:模型和执行环境都在自己手里,迭代速度最快。