Agent memory 这个词已经烂大街了,但体感下来,十个人聊 memory,八个人说的不是同一件事。
我梳理了一下,市面上说的"memory"至少有四层意思,混着聊就是口径不一致:
一,短期记忆:最近 n 条对话 history,所有 AI 产品自动带的,你在一个会话框里聊过的东西模型都知道,这不叫"有记忆",这叫"聊天历史"。
二,固定背景:你的名字、偏好、项目上下文这些不变的东西,CLAUDE.md、ChatGPT 的 Custom Instructions、OpenClaw 的 user.md 解决的就是这个,手动维护或者 Agent 帮助更新,一次写好长期生效。
三,自动沉淀:聊了几十轮之后 context window 撑不住了,模型该自己提炼有价值的信息存下来,关键时刻能调出来,Claude Code 的 project memory、OpenClaw 的 memory.md 走的是这条路。往企业级推,成百上千用户的记忆需要存储、检索、遗忘、冲突处理,这就是 mem0 这类中间件干的事了。
四,完整上下文:Agent 长时间自主运行,产生的文档、代码、工具调用结果,已经不只是"记忆"了,是整个上下文的结构化管理,字节开源的 OpenViking 定位在这一层,用文件系统范式统一组织 memory + resource + skill,思路比单纯做 memory 大一截。
大部分人讨论 memory 的时候其实卡在层次二和层次三之间,真正拉开差距的是层次三的自动提取、存储、检索能力,这才是 Agent 从"工具"变"同事"的分水岭,而这里面含有大量的工程化的细节要去做。
ps:企业做 Agent 选型可以看看 mem0,开源轻量级,LOCOMO benchmark 上比 OpenAI Memory 准确率高 26%,定位是 Agent 和存储之间的中间件层,支持广,插上就能走不错的 memory 能力。