AI研究员Han Xiao分享了一个自己观察到的Agent工作流范式转变。

2025年的深度研究模式

搜索 → 阅读 → 推理 → 重复,直到完成

每个循环都访问Web,实时获取最新信息。

2026年的长程任务变成两个截然不同的阶段

阶段一:Web IO(研究和规划)

搜索、阅读、推理。目标不是直接产出答案,而是把Web知识物化到本地文件(.md/.json/.csv)。

阶段二:Agent挂载文件,启动循环

Agent读取、运行、写入,全部基于本地文件,不再有Web调用来做锚定(grounding)。

为什么放弃Web grounding

确定性:本地文件是不变的快照。Web内容会变、会404、会遇到付费墙。

速度:文件系统读取毫秒级,Web获取秒级。Agent循环需要紧密迭代。

一致性:交叉检查需要基于同一个知识库,而不是每次抓取不同版本。

成本:Web IO消耗大量Token解析HTML噪声。本地文件已经是干净的。