客户接入时几乎都会问云 egress 费用的问题。任何跑在你云账户外部的公共服务,调用时都要收全量 egress——哪怕实际在同一个区域。很坑,但大客户可以走私有网络绕开。

有一次聊 Databricks 收购,问他们怎么处理客户对 egress 的不满。对方说:"从来没被问过。"——史上最大无服务器数据库提供商,客户居然不担心 egress?为什么?

后来又和人聊 Archil,对方脱口而出:"你们和 WarpStream 有一样的问题吧?大家都在担心 egress,因为客户必须 1:1 读取放进服务的每一个字节。"那一刻,Hunter 开窍了。


数据库和文件系统的本质区别

在数据库里做搜索:发送查询语句,数据库内部执行计算,只返回匹配结果。

在文件系统里做搜索:你的机器把每个要搜索的文件全部下载到内存里,本地找匹配。

一次搜索在文件系统上可能是 100GB egress,在数据库上可能不到 2KB。数据库传输的是和数据交互的指令。文件系统传输的是原始数据本身


洞察:Bash 就是文件系统的 SQL

既然数据库能嵌入计算,文件系统也可以。

让客户端发送 bash 命令,在文件系统内部执行,只返回结果——不传输原始数据。

好处:

  • 零 egress 费用
  • 无延迟焦虑
  • 无需预估实例规格
  • 执行层可以在内部做 planner 优化、跨计算资源分发

这正是 Archil 正在做的事——serverless execution,文件系统内置计算作为一等公民。


对 AI 的影响

AI 时代是大多数开发者第一次必须思考有状态系统:对话历史、提示词、记忆、上下文都是状态管理问题。Serverless execution 会成为这个技术栈的关键基础设施。

Archil 宣布 serverless execution 今日向所有 Archil 文件系统推送。