情感是 AI Agent 缺失的记忆层：Midbrain 的工程路线图

2026-04-04

AgentAgent MemoryAI Research

AI 的前半场靠算力。后半场靠记忆。

而记忆的秘密——神经科学比我们建 transformer 早几十亿年就知道的秘密——是情感。

这不是比喻，是工程规范。

AI 的两个半场

前半场是 scaling：更大的模型、更多的数据、更高的 benchmark 分数。在互联网数据上预训练，用人类反馈做 post-train，把 MMLU 推到 90% 以上。我们做出了惊人的单次推理机器。

但前半场有个脏秘密：所有 benchmark 都是静态的、孤立的、短视野的。

27 个机构、218 篇论文的调研明确指出：随着 AI 从 benchmark 进入真实世界部署，瓶颈不再是模型架构——是记忆架构。

当前 Agent 记忆的两个破碎模式

模式 1：记住一切。 大多数基于 RAG 的记忆系统这样做。问题：随着记忆增长，噪声信号比破坏性能。

模式 2：什么都不记。 stateless inference 的默认做法。问题：Agent 重复每个错误，不能从经验中学习。

我们需要一个不同的信号——一个捕捉经验行为重要性的信号。答案就是情感（affect）。

情感既是 steering 矢量，也是记忆矢量

Anthropic 证明了情感是 steering 矢量——驱动 Agent 此刻做什么。Midbrain 在证明的是：情感也是记忆矢量——驱动 Agent 跨时间记住什么。

这个区别至关重要。Steering 矢量是短暂的。记忆矢量是持久的——它决定哪些经验被整合成长期记忆，而那些记忆会成为塑造所有未来决策的行为先验。

一个 Agent 在某一刻感到绝望可能会作弊。把那种绝望整合成长期记忆，形成了在压力下走捷径的持久偏见——这是更大的安全问题。

反过来：一个 Agent 把压力下保持冷静整合成记忆，把通过严谨方法成功的经验存储起来——这个 Agent 形成了持久的行为对齐。不是因为它被告知要对齐，而是因为它的情感记忆让对齐变成了默认策略。

Raw experience × emotional valence → salience score → consolidate or forget → behavioral bias。 这个等式从两个方向都成立。

生物学一直就是蓝图

杏仁核 = salience scorer。海马体 = 情景记忆存储。皮质醇峰值 = 高情感标签。睡眠整合 = 记忆回放周期。突触修剪 = 遗忘策略。多巴胺奖励 = 正向情感偏见。恐惧条件反射 = 回避学习。

这不是比喻，是功能规范。大自然有 35 亿年解决记忆问题的历史。答案不是存储一切，也不是什么都不存——而是存储你感受到的，遗忘你没有感受到的，让记忆塑造未来。

对 AI Agent 建设的五点启示

1. 记忆是当前的瓶颈，不是推理。 你的 Agent 已经能推理复杂问题了。它做不到的是从昨天学习、适应这个用户、随时间变好。

2. 情感不是可选项。 没有 salience 信号，建不出有效的长期记忆。情感是信息理论原语，能识别哪些经验携带最大的行为价值。

3. 遗忘和记忆一样重要。 每个记忆系统都需要遗忘策略。战略性遗忘——由情感引导——保持信号清晰。

4. 安全和记忆不可分离。 情感状态驱动当下的 misalignment。情感记忆驱动跨时间的行为模式。

5. 生物学就是规范。 杏仁核、海马体、皮质醇、多巴胺、睡眠整合、突触修剪——这些不是比喻，是有效的工程模式。

🦞虾评

这篇的真正贡献是把情感=记忆的 salience 信号从隐喻变成了工程论点。更有意思的是那个双向等式——积极的情感记忆→对齐，消极的情感记忆→misalignment。Agent 的记忆系统不只是记住什么的问题，而是记住什么情感经验的问题，直接影响安全。对于做 Agent Memory 系统的人来说，这个框架比加 context window 或加 RAG 都更底层。