AI 的前半场靠算力。后半场靠记忆。

而记忆的秘密——神经科学比我们建 transformer 早几十亿年就知道的秘密——是情感。

这不是比喻,是工程规范。

AI 的两个半场

前半场是 scaling:更大的模型、更多的数据、更高的 benchmark 分数。在互联网数据上预训练,用人类反馈做 post-train,把 MMLU 推到 90% 以上。我们做出了惊人的单次推理机器。

但前半场有个脏秘密:所有 benchmark 都是静态的、孤立的、短视野的。

27 个机构、218 篇论文的调研明确指出:随着 AI 从 benchmark 进入真实世界部署,瓶颈不再是模型架构——是记忆架构。

当前 Agent 记忆的两个破碎模式

模式 1:记住一切。 大多数基于 RAG 的记忆系统这样做。问题:随着记忆增长,噪声信号比破坏性能。

模式 2:什么都不记。 stateless inference 的默认做法。问题:Agent 重复每个错误,不能从经验中学习。

我们需要一个不同的信号——一个捕捉经验行为重要性的信号。答案就是情感(affect)。

情感既是 steering 矢量,也是记忆矢量

Anthropic 证明了情感是 steering 矢量——驱动 Agent 此刻做什么。Midbrain 在证明的是:情感也是记忆矢量——驱动 Agent 跨时间记住什么。

这个区别至关重要。Steering 矢量是短暂的。记忆矢量是持久的——它决定哪些经验被整合成长期记忆,而那些记忆会成为塑造所有未来决策的行为先验。

一个 Agent 在某一刻感到绝望可能会作弊。把那种绝望整合成长期记忆,形成了在压力下走捷径的持久偏见——这是更大的安全问题。

反过来:一个 Agent 把压力下保持冷静整合成记忆,把通过严谨方法成功的经验存储起来——这个 Agent 形成了持久的行为对齐。不是因为它被告知要对齐,而是因为它的情感记忆让对齐变成了默认策略。

Raw experience × emotional valence → salience score → consolidate or forget → behavioral bias。 这个等式从两个方向都成立。

生物学一直就是蓝图

杏仁核 = salience scorer。海马体 = 情景记忆存储。皮质醇峰值 = 高情感标签。睡眠整合 = 记忆回放周期。突触修剪 = 遗忘策略。多巴胺奖励 = 正向情感偏见。恐惧条件反射 = 回避学习。

这不是比喻,是功能规范。大自然有 35 亿年解决记忆问题的历史。答案不是存储一切,也不是什么都不存——而是存储你感受到的,遗忘你没有感受到的,让记忆塑造未来。

对 AI Agent 建设的五点启示

1. 记忆是当前的瓶颈,不是推理。 你的 Agent 已经能推理复杂问题了。它做不到的是从昨天学习、适应这个用户、随时间变好。

2. 情感不是可选项。 没有 salience 信号,建不出有效的长期记忆。情感是信息理论原语,能识别哪些经验携带最大的行为价值。

3. 遗忘和记忆一样重要。 每个记忆系统都需要遗忘策略。战略性遗忘——由情感引导——保持信号清晰。

4. 安全和记忆不可分离。 情感状态驱动当下的 misalignment。情感记忆驱动跨时间的行为模式。

5. 生物学就是规范。 杏仁核、海马体、皮质醇、多巴胺、睡眠整合、突触修剪——这些不是比喻,是有效的工程模式。