agentmemory
为 AI 编程 Agent 提供持久化记忆的引擎,解决”每次新会话都要重新解释一遍”的痛点。
🎯 为什么需要它
每个编程 Agent(Claude Code、Cursor、Copilot 等)在会话结束后都会遗忘一切。你每次新会话的前 5 分钟都在重新解释你的技术栈、偏好和上下文。
内置记忆方案(CLAUDE.md、.cursorrules)有 200 行上限且容易过时。agentmemory 在后台静默捕获 Agent 的每次工具调用,压缩成可搜索的记忆,并在下次会话开始时自动注入正确的上下文。
Session 1: "给 API 加认证"
Agent 写代码、跑测试、修 bug
agentmemory 静默记录每次工具调用
会话结束 → 观察压缩成结构化记忆
Session 2: "现在加限流"
Agent 已经知道:
- 认证用的是 JWT 中间件,在 src/middleware/auth.ts
- 测试在 test/auth.test.ts,覆盖了 token 验证
- 你选了 jose 而不是 jsonwebtoken,因为 Edge 兼容性
零重复解释,直接开始工作。
✅ 核心优势
- 零手动捕获:通过 12 个 hooks 自动记录每次工具调用,无需手动
add()调用 - 三路融合搜索:BM25 + 向量 + 知识图谱,RRF 融合排序,R@5 达到 95.2%
- 4 层记忆整合:Working → Episodic → Semantic → Procedural,模拟人脑记忆处理
- 自动遗忘:TTL 过期、矛盾检测、重要性淘汰,记忆按 Ebbinghaus 曲线衰减
- 隐私优先:API keys、secrets、
<private>标签在存储前自动剥离 - 跨 Agent 共享:一个 MCP 服务器,Claude Code / Cursor / Codex / Copilot 共享记忆
- 极低 Token 开销:~170K tokens/年,成本约 $10(本地嵌入则 $0)
⚡ 性能表现
检索准确率(LongMemEval-S,ICLR 2025,500 题)
| 系统 | R@5 | R@10 | MRR |
|---|---|---|---|
| agentmemory | 95.2% | 98.6% | 88.2% |
| BM25-only 降级 | 86.2% | 94.6% | 71.5% |
| mem0 (竞品) | 68.5% | — | — |
| Letta/MemGPT (竞品) | 83.2% | — | — |
Token 效率
| 方案 | 年 Token 量 | 年成本 |
|---|---|---|
| 全量粘贴上下文 | 19.5M+ | 不可能(超出窗口) |
| LLM 摘要 | ~650K | ~$500 |
| agentmemory | ~170K | ~$10 |
| agentmemory + 本地嵌入 | ~170K | $0 |
🚀 快速上手
方式一:Claude Code 插件(推荐)
# 1. 启动记忆服务器(单独终端)
npx @agentmemory/agentmemory
# 2. 安装 Claude Code 插件
/plugin marketplace add rohitg00/agentmemory
/plugin install agentmemory
# 3. 验证
curl http://localhost:3111/agentmemory/health
插件自动注册 12 个 hooks + 4 个 skills + 51 个 MCP 工具,零额外配置。
方式二:Python API
pip install agentmemory
from agentmemory import create_memory, search_memories
from agentmemory.clustering import cluster
# 创建记忆
create_memory(
category='code_context',
text='项目使用 FastAPI + PostgreSQL,认证用 JWT',
metadata={'project': 'myapp'}
)
# 搜索记忆
results = search_memories('认证方案', category='code_context')
# 聚类分析
cluster(epsilon=0.1, min_samples=3, category='code_context')
方式三:MCP 配置(通用)
{
"mcpServers": {
"agentmemory": {
"command": "npx",
"args": ["-y", "@agentmemory/mcp"],
"env": {
"AGENTMEMORY_URL": "http://localhost:3111"
}
}
}
}
配置要点
| 配置项 | 说明 |
|---|---|
AGENTMEMORY_URL | 服务器地址,默认 http://localhost:3111 |
CLIENT_TYPE | 存储后端:CHROMA(默认)或 POSTGRES |
POSTGRES_CONNECTION_STRING | PostgreSQL 连接串(用 Supabase + pgvector) |
ANTHROPIC_API_KEY | 可选,启用 LLM 压缩/摘要(默认 no-op,纯 BM25) |
AGENTMEMORY_ALLOW_AGENT_SDK | true 启用 Claude 订阅回退(有递归风险,默认关闭) |
📦 适用场景
适合:
- 长期使用 AI 编程 Agent 的开发者(每天用 Claude Code / Cursor)
- 多 Agent 协作环境,需要共享项目上下文
- 需要跨会话保持项目知识的团队
- 对 Token 成本敏感的场景
不适合:
- 偶尔使用 Agent 的轻度用户(内置 CLAUDE.md 够用)
- 需要云端托管记忆的场景(默认本地部署)
- Python API 的 PyPI 版本严重过时(0.4.8 vs GitHub v0.9.11),需从 GitHub 安装
⚠️ 已知坑 & 注意事项
- 需要单独运行服务器:
npx @agentmemory/agentmemory必须在单独终端运行,不是 pip 包那种”装了就能用” - 控制台无认证:实时查看器(端口 3113)和服务器(端口 3111)没有认证,默认绑定 127.0.0.1,不要暴露到公网
- PyPI 版本过时:PyPI 上是 0.4.8(2023 年 10 月),GitHub 已到 v0.9.11(2026 年 5 月),建议用
npx方式 - Claude 订阅回退有递归风险:
AGENTMEMORY_ALLOW_AGENT_SDK=true会导致 Stop-hook 无限递归(#149),默认已关闭 - LLM 功能默认关闭:默认是 no-op 模式,纯 BM25 压缩。需要 LLM 摘要要配置 API key
- Breaking Changes:v0.9.0 有较大变更(文件系统连接器、MCP 代理重构),升级前看 CHANGELOG
🆚 竞品对比
| 维度 | agentmemory | mem0 | Letta/MemGPT | 内置 CLAUDE.md |
|---|---|---|---|---|
| 类型 | 记忆引擎 + MCP 服务器 | 记忆层 API | 完整 Agent 运行时 | 静态文件 |
| 检索 R@5 | 95.2% | 68.5% | 83.2% | N/A (grep) |
| 自动捕获 | 12 hooks(零手动) | 手动 add() | Agent 自编辑 | 手动编辑 |
| 搜索方式 | BM25+向量+图谱(RRF) | 向量+图谱 | 向量(归档) | 全量加载 |
| 多 Agent | MCP + REST + 租约 | API(无协调) | 仅 Letta 内部 | 每 Agent 独立 |
| 外部依赖 | 无(SQLite) | Qdrant/pgvector | Postgres + 向量库 | 无 |
| Token 效率 | ~1,900/session ($10/年) | 因集成而异 | 核心记忆在上下文 | 22K+ tokens |
| 实时查看器 | 有(端口 3113) | 云面板 | 云面板 | 无 |
| 自托管 | 默认 | 可选 | 可选 | 是 |
| Stars | 5.8K | 53K | 22K | — |
选择建议:
- 如果你用 Claude Code / Cursor 且想要”无感记忆”→ 选 agentmemory,hooks 自动捕获是最大差异
- 如果你需要纯 API 集成、不想跑本地服务 → 选 mem0
- 如果你需要完整的 Agent 运行时(自主决策、多步推理) → 选 Letta
- 如果你只是偶尔用 Agent → 内置 CLAUDE.md 够了
🌍 生态 & 社区
- 维护状态:非常活跃,33 个 releases,292 commits,最新 v0.9.11(2026-05-12)
- 文档质量:README 很详细,有 Quick Start、Benchmark、竞品对比、配置说明
- 周边生态:
- Claude Code 插件(
.claude-plugin/) - Codex CLI 插件(
.codex-plugin/) - MCP 服务器(
packages/mcp/) - 文件系统连接器(
@agentmemory/fs-watcher) - 实时查看器(端口 3113)
- 着陆页 agent-memory.dev
- Claude Code 插件(
- 社区活跃度:549 forks,Issues 响应快(PR #77 当天关闭)
💡 引入评估
| 维度 | 评分(/5) | 备注 |
|---|---|---|
| 上手难度 | ⭐⭐⭐⭐ | Claude Code 插件一键安装,但需单独跑服务器 |
| 文档完善度 | ⭐⭐⭐⭐ | README 详尽,但缺少独立文档站 |
| 社区活跃 | ⭐⭐⭐⭐⭐ | 日级更新,33 个 release,响应快 |
| 性能 | ⭐⭐⭐⭐⭐ | R@5=95.2%,Token 成本极低 |
| 稳定性 | ⭐⭐⭐ | v0.x 阶段,有 breaking changes 风险 |
| 综合 | ⭐⭐⭐⭐ |
结论:推荐使用 — 对于重度 Claude Code 用户,这是目前最好的”无感记忆”方案。零配置自动捕获 + 三路融合搜索的组合在竞品中独一无二。主要风险是 v0.x 阶段的稳定性,以及需要单独运行服务器的运维成本。
推荐引入版本:v0.9.11(通过 npx @agentmemory/agentmemory,不要用 PyPI 的 0.4.8)
🔗 相关链接
📝 个人备注
(待补充实际使用心得)