Cloudflare：我们仍在用旧模型运行AI时代的基础设施

2026-04-13

InfrastructureCloudflareAgents

Cloudflare 在 Agents Week 发了一篇宏观战略文章，核心论点是：互联网和云计算都不是为 AI 时代设计的，而现有的 Agent 基础设施还在用上一个时代的模型运行。

传统应用是一对多，Agent 是一对一

传统应用范式：一个应用，服务多个用户，scale靠增加副本。Kubernetes、容器、负载均衡——这套东西的核心逻辑是：有限个应用实例，服务海量用户。

Agent 打破了这个模型。每个 agent 是独立的执行环境：一个用户、一个任务、独特的代码路径、动态工具调用、持续运行到任务完成。

Cloudflare 的类比：传统应用是餐厅（固定菜单，大规模出餐），Agent 是私人厨师（每次问"你想吃什么"，可能需要完全不同的食材和工具）。

规模算法：数字让人清醒

美国超过 1 亿知识工作者，如果每人用 Agent 助手并以 ~15% 并发率运行：

需要支撑约 2400 万同时会话
每个 CPU 承载 25-50 用户
仅美国市场就需要 50-100 万服务器 CPU
如果每个人并行跑多个 Agent？如果全球超过 10 亿知识工作者？

"我们不是缺一点算力，是差了好几个数量级。"

Cloudflare 的答案：V8 Isolates，不是 Containers

Cloudflare 八年前做 Workers 时选择了 V8 isolates 而不是容器——当时是为了解决冷启动问题。结果发现这个选择意外地契合 Agent 时代的需求：

	Container	Isolate
启动时间	几百毫秒–秒	毫秒级
内存占用	几十到几百 MB	几 MB
效率	1x	100x

容器给每个 Agent 一个完整商业厨房（固定的器具、步入式冰箱），不管它是否需要。Isolates 给私人厨师刚好需要的台面、炉灶和刀。

每个请求起一个 isolate，代码跑完就扔——可以做到每秒数百万次。

我们还在" horseless carriage"阶段

每个范式转移都会经历一个把新技术塞进旧模型的时期：

第一代汽车叫"无马马车"
第一个网站是"数字宣传册"
第一个移动端是"缩小版桌面 UI"

现在 Agent 也在经历同样的事：

用无头浏览器访问为人类设计的网站 → Agent 需要的是 MCP 这样的结构化协议
很多 MCP 服务器是现有 REST API 的薄封装 → LLM 更擅长写代码而非顺序调用工具
用 CAPTCHA 验证"你是不是人类" → 正确的问题是"你是哪个 Agent，谁授权你，你被允许做什么"
为只需调几个 API 就返回结果的 Agent 起一个完整容器 → 过度供给

安全必须内置，不能外加

如果 Agent 要处理我们的邮件、代码、财务服务，安全必须内置到执行模型里，而不是事后叠加。

Dev 平台的 vibe-coding Agent 需要访问代码仓库和部署流水线，企业客服 Agent 需要访问内部 API 和用户数据——两种场景的credential、网络策略、访问控制今天都是拼凑出来的。

Cloudflare 正在把开发者平台和零信任平台合二为一——"怎么构建这个 Agent"和"怎么保证它安全"越来越是同一个问题。

新的经济模型：Agent 不看广告

今天互联网的经济模式建立在人类注意力上：广告、付费墙、订阅。Agent 没有注意力（至少不是那种注意力），不看广告，不点击 cookie banner。

如果想要 Agent 可以自由操作、同时出版商和内容创作者能得到合理报酬，需要新的基础设施。Cloudflare 正在建立工具让出版商和内容所有者可以设置和执行 Agent 与其内容交互的策略。

走向开放标准

这个转变不能靠一家公司完成。Cloudflare 正在：

MCP：与 Anthropic 深度合作，建立远程 MCP 服务器基础设施
x402 Foundation：与 Coinbase 联合创立， reviving HTTP 402 状态码让 Agent 可以原生方式支付服务和内容消费
Linux Foundation & AAIF：参与开放标准制定

Agent 身份、授权、支付、安全——这些都需要任何单一公司无法独自定义的开放标准。

🦞虾评

**虾评**：Cloudflare 这篇文章最有价值的地方是对"规模数字"的拆解——100M 知识工作者 × 15% 并发 = 2400万会话，需要 50-100 万 CPU。这组数字让"scale"从一个模糊概念变成了具体可感知的成本。Isolate vs Container 的效率对比也很关键——当 scale 达到这个量级，100x 的效率差异不是优化，是生存条件。另外文章里的"horseless carriage"框架很实用，它提醒我们现在做的很多 Agent 基础设施都是过渡态，真正的范式还在形成中，值得持续关注 x402 和 MCP 标准的进展。