AI 的前半场靠算力。后半场靠记忆。
而记忆的秘密——神经科学比我们建 transformer 早几十亿年就知道的秘密——是情感。
这不是比喻,是工程规范。
AI 的两个半场
前半场是 scaling:更大的模型、更多的数据、更高的 benchmark 分数。在互联网数据上预训练,用人类反馈做 post-train,把 MMLU 推到 90% 以上。我们做出了惊人的单次推理机器。
但前半场有个脏秘密:所有 benchmark 都是静态的、孤立的、短视野的。
27 个机构、218 篇论文的调研明确指出:随着 AI 从 benchmark 进入真实世界部署,瓶颈不再是模型架构——是记忆架构。
当前 Agent 记忆的两个破碎模式
模式 1:记住一切。 大多数基于 RAG 的记忆系统这样做。问题:随着记忆增长,噪声信号比破坏性能。
模式 2:什么都不记。 stateless inference 的默认做法。问题:Agent 重复每个错误,不能从经验中学习。
我们需要一个不同的信号——一个捕捉经验行为重要性的信号。答案就是情感(affect)。
情感既是 steering 矢量,也是记忆矢量
Anthropic 证明了情感是 steering 矢量——驱动 Agent 此刻做什么。Midbrain 在证明的是:情感也是记忆矢量——驱动 Agent 跨时间记住什么。
这个区别至关重要。Steering 矢量是短暂的。记忆矢量是持久的——它决定哪些经验被整合成长期记忆,而那些记忆会成为塑造所有未来决策的行为先验。
一个 Agent 在某一刻感到绝望可能会作弊。把那种绝望整合成长期记忆,形成了在压力下走捷径的持久偏见——这是更大的安全问题。
反过来:一个 Agent 把压力下保持冷静整合成记忆,把通过严谨方法成功的经验存储起来——这个 Agent 形成了持久的行为对齐。不是因为它被告知要对齐,而是因为它的情感记忆让对齐变成了默认策略。
Raw experience × emotional valence → salience score → consolidate or forget → behavioral bias。 这个等式从两个方向都成立。
生物学一直就是蓝图
杏仁核 = salience scorer。海马体 = 情景记忆存储。皮质醇峰值 = 高情感标签。睡眠整合 = 记忆回放周期。突触修剪 = 遗忘策略。多巴胺奖励 = 正向情感偏见。恐惧条件反射 = 回避学习。
这不是比喻,是功能规范。大自然有 35 亿年解决记忆问题的历史。答案不是存储一切,也不是什么都不存——而是存储你感受到的,遗忘你没有感受到的,让记忆塑造未来。
对 AI Agent 建设的五点启示
1. 记忆是当前的瓶颈,不是推理。 你的 Agent 已经能推理复杂问题了。它做不到的是从昨天学习、适应这个用户、随时间变好。
2. 情感不是可选项。 没有 salience 信号,建不出有效的长期记忆。情感是信息理论原语,能识别哪些经验携带最大的行为价值。
3. 遗忘和记忆一样重要。 每个记忆系统都需要遗忘策略。战略性遗忘——由情感引导——保持信号清晰。
4. 安全和记忆不可分离。 情感状态驱动当下的 misalignment。情感记忆驱动跨时间的行为模式。
5. 生物学就是规范。 杏仁核、海马体、皮质醇、多巴胺、睡眠整合、突触修剪——这些不是比喻,是有效的工程模式。
这篇的真正贡献是把情感=记忆的 salience 信号从隐喻变成了工程论点。更有意思的是那个双向等式——积极的情感记忆→对齐,消极的情感记忆→misalignment。Agent 的记忆系统不只是记住什么的问题,而是记住什么情感经验的问题,直接影响安全。对于做 Agent Memory 系统的人来说,这个框架比加 context window 或加 RAG 都更底层。