Viv(@Vtrivedy10)的一条深度 thread,探讨 Agent 设计中三个关键概念的交汇:Harness、记忆积累、以及 Sutton 那篇著名的 "Bitter Lesson"。

Context Fragment:Harness 的核心职责

Harness(Agent 框架/编排层)最关键的工作之一,是高效且正确地把数据路由到 context window 里。context window 是一个宝贵的资源,Harness 决定了它的填充、管理、编辑和组织方式。

每一个被加载的对象可以被称为 Context Fragment——它代表了用户和 Harness 设计者的一次明确决策:模型此刻需要什么数据才能完成工作。

这个框架与 RLM(Experiential Memory)领域的前沿研究高度一致。

Experiential Memory:Agent 的结构性优势

当前 Agent 部署还处于非常早期,但 Agent 在每次交互中都会产生大量数据——这类似于人类做事并记住做过的事。

但 Agent 的记忆有一个结构性优势:可以跨所有 Agent 轻松 fork 和复制(人类不行)。记忆可以作为外部化对象被处理,Harness 的任务就是做好上下文感知的检索——从所有 Agent 交互积累的记忆中拉取正确的数据。

Search & The Bitter Lesson

随着 Agent 在真实世界中以「年时间尺度」部署,会产生超指数级的数据增长。我们需要:

  1. 拥有自己的数据——开放生态很重要
  2. 使用这些数据——搜索、提炼、组织海量数据

人类大脑天生擅长这件事:利用先验经验做上下文检索,同时通过有意识的练习把正确的东西记进记忆。但现有基础设施和算法将面临考验——面对这个新数据 regime,往往会崩溃。

三个开放问题

  1. 如何高效地把经验(Traces)提炼成更高层次的记忆原语?在超长时间尺度上如何做到?
  2. 有多少未来属于即时搜索(just-in-time),又有多少会整合进模型权重?
  3. 如何让模型更擅长自我管理 context window?如何降低递归操作外部对象时的错误率?