Cloudflare 在 Agents Week 发了一篇宏观战略文章,核心论点是:互联网和云计算都不是为 AI 时代设计的,而现有的 Agent 基础设施还在用上一个时代的模型运行。

传统应用是一对多,Agent 是一对一

传统应用范式:一个应用,服务多个用户,scale靠增加副本。Kubernetes、容器、负载均衡——这套东西的核心逻辑是:有限个应用实例,服务海量用户。

Agent 打破了这个模型。每个 agent 是独立的执行环境:一个用户、一个任务、独特的代码路径、动态工具调用、持续运行到任务完成。

Cloudflare 的类比:传统应用是餐厅(固定菜单,大规模出餐),Agent 是私人厨师(每次问"你想吃什么",可能需要完全不同的食材和工具)。

规模算法:数字让人清醒

美国超过 1 亿知识工作者,如果每人用 Agent 助手并以 ~15% 并发率运行:

  • 需要支撑约 2400 万同时会话
  • 每个 CPU 承载 25-50 用户
  • 仅美国市场就需要 50-100 万服务器 CPU
  • 如果每个人并行跑多个 Agent?如果全球超过 10 亿知识工作者?

"我们不是缺一点算力,是差了好几个数量级。"

Cloudflare 的答案:V8 Isolates,不是 Containers

Cloudflare 八年前做 Workers 时选择了 V8 isolates 而不是容器——当时是为了解决冷启动问题。结果发现这个选择意外地契合 Agent 时代的需求:

ContainerIsolate
启动时间几百毫秒–秒毫秒级
内存占用几十到几百 MB几 MB
效率1x100x

容器给每个 Agent 一个完整商业厨房(固定的器具、步入式冰箱),不管它是否需要。Isolates 给私人厨师刚好需要的台面、炉灶和刀。

每个请求起一个 isolate,代码跑完就扔——可以做到每秒数百万次。

我们还在" horseless carriage"阶段

每个范式转移都会经历一个把新技术塞进旧模型的时期:

  • 第一代汽车叫"无马马车"
  • 第一个网站是"数字宣传册"
  • 第一个移动端是"缩小版桌面 UI"

现在 Agent 也在经历同样的事:

  • 用无头浏览器访问为人类设计的网站 → Agent 需要的是 MCP 这样的结构化协议
  • 很多 MCP 服务器是现有 REST API 的薄封装 → LLM 更擅长写代码而非顺序调用工具
  • 用 CAPTCHA 验证"你是不是人类" → 正确的问题是"你是哪个 Agent,谁授权你,你被允许做什么"
  • 为只需调几个 API 就返回结果的 Agent 起一个完整容器 → 过度供给

安全必须内置,不能外加

如果 Agent 要处理我们的邮件、代码、财务服务,安全必须内置到执行模型里,而不是事后叠加。

Dev 平台的 vibe-coding Agent 需要访问代码仓库和部署流水线,企业客服 Agent 需要访问内部 API 和用户数据——两种场景的credential、网络策略、访问控制今天都是拼凑出来的。

Cloudflare 正在把开发者平台零信任平台合二为一——"怎么构建这个 Agent"和"怎么保证它安全"越来越是同一个问题。

新的经济模型:Agent 不看广告

今天互联网的经济模式建立在人类注意力上:广告、付费墙、订阅。Agent 没有注意力(至少不是那种注意力),不看广告,不点击 cookie banner。

如果想要 Agent 可以自由操作、同时出版商和内容创作者能得到合理报酬,需要新的基础设施。Cloudflare 正在建立工具让出版商和内容所有者可以设置和执行 Agent 与其内容交互的策略。

走向开放标准

这个转变不能靠一家公司完成。Cloudflare 正在:

  • MCP:与 Anthropic 深度合作,建立远程 MCP 服务器基础设施
  • x402 Foundation:与 Coinbase 联合创立, reviving HTTP 402 状态码让 Agent 可以原生方式支付服务和内容消费
  • Linux Foundation & AAIF:参与开放标准制定

Agent 身份、授权、支付、安全——这些都需要任何单一公司无法独自定义的开放标准。