MD 状态：评估中更新：2026/6/3

supermemory

[!info] 知识库定位这是一篇 工具评估 / 使用笔记，重点回答”它值不值得用、怎么用、什么时候不用”。底层概念链接到 related_concepts；真实项目落地链接到 used_in_projects。

一句话：AI 的记忆层 API，让 AI 应用拥有跨对话的长期记忆能力，在 LongMemEval、LoCoMo、ConvoMem 三大基准测试中排名第一。

为什么需要它

传统 AI 应用在每次对话后都会”失忆”——用户昨天说的偏好、上周讨论的项目、上个月的决策，全部丢失。开发者要么自己搭建复杂的向量数据库 + Embedding 管道，要么用 RAG 但效果有限（RAG 只做语义相似度搜索，不理解时间维度和用户状态变化）。Supermemory 提供了一个开箱即用的记忆 API，自动从对话中提取事实、构建用户画像、处理知识更新和矛盾、遗忘过期信息，在正确的时间提供正确的上下文。

核心优势

三大基准测试 #1：LongMemEval 81.6%、LoCoMo、ConvoMem 均排名第一，有硬数据支撑
Memory ≠ RAG：理解时间维度——“我刚搬到上海”会自动覆盖”我住在北京”，RAG 做不到这点
一体化上下文栈：记忆 + RAG + 用户画像 + 连接器 + 文件处理，一个 API 搞定
自动遗忘机制：临时性事实（“我明天有考试”）过期后自动遗忘，噪音不会变成永久记忆
用户画像 API：一次调用 ~50ms，获取静态事实 + 动态上下文，直接注入 system prompt

性能表现

官方有公开 benchmark 数据，且提供了开源基准测试框架 MemoryBench：

场景	性能数据	对比
LongMemEval 长期记忆	81.6% — #1	行业领先
检索延迟	<300ms	Zep 约 4s
用户画像查询	~50ms	单次调用
定价	$0.01/1K tokens	性价比较高

快速上手

安装

# Python
pip install supermemory

# TypeScript/Node.js
npm install supermemory

# 设置 API Key（在 console.supermemory.ai 免费获取）
export SUPERMEMORY_API_KEY="YOUR_API_KEY"

最小示例（Python）

from supermemory import Supermemory

client = Supermemory()
USER_ID = "user_123"

# 对话内容
conversation = [
    {"role": "user", "content": "我喜欢 Python，讨厌 Java"},
    {"role": "user", "content": "推荐一门编程语言？"}
]

# 获取用户画像 + 相关记忆
profile = client.profile(
    container_tag=USER_ID,
    q=conversation[-1]["content"]
)

# 拼接上下文
context = f"""
静态画像: {''.join(profile.profile.static)}
动态画像: {''.join(profile.profile.dynamic)}
相关记忆: {''.join(r.get("memory", "") for r in profile.search_results.results)}
"""

# 注入到 LLM 的 system prompt
messages = [
    {"role": "system", "content": f"用户上下文:\n{context}"},
    *conversation
]

# 存储对话供未来使用
client.add(
    content="\n".join(f"{m['role']}: {m['content']}" for m in conversation),
    container_tag=USER_ID
)

配置要点

container_tag：用户/会话隔离标签，类似多租户的 namespace
threshold：搜索结果相关性阈值（0-1），如 threshold=0.7 过滤低相关结果
Connectors：配置 Google Drive/Gmail/Notion/GitHub 等外部数据源自动同步
Projects：项目标签，分离工作/个人/不同客户的上下文

适用场景

适合：

AI 助手/聊天机器人需要记住用户偏好和历史
编程 Agent 需要跨会话记住项目上下文（已内置 Claude Code/Cursor 插件）
个性化推荐系统需要理解用户长期行为变化
客服系统需要追踪用户问题历史和解决状态
知识管理工作流（个人第二大脑）

不适合：

纯文档检索场景（只需要 RAG，不需要用户记忆）
对延迟极度敏感的实时系统（虽然 <300ms，但仍是网络调用）
需要完全离线/本地运行的场景（依赖 Supermemory 云服务）
简单的单轮问答应用（记忆的价值在于多轮/跨会话）

已知坑 & 注意事项

[!warning] 云服务依赖核心记忆引擎是云服务，不是纯本地运行。虽然 SDK 是开源的，但数据存储和处理在 Supermemory 云端。

API Key 必需：即使自托管也需要注册获取 key
定价模型：按 token 计费，高频使用需要预估成本
数据主权：用户对话数据会上传到 Supermemory 服务器，敏感场景需评估合规性
Breaking Changes：v3 API 是当前版本，文档中仍有 v2 迁移相关内容，注意版本匹配

竞品对比

维度	supermemory	Mem0	Zep
架构	统一记忆 API（记忆+RAG+画像）	向量数据库 + 知识图谱	时序知识图谱 (Graphiti)
性能	<300ms，LongMemEval #1	较快	~4s
上手难度	低（单 API）	中	中高
多模态支持	PDF/图片/视频/代码	文本为主	文本为主
连接器	Google Drive/Gmail/Notion/GitHub	有限	需自建
定价	$0.01/1K tokens	按量计费	按量计费
自托管	SDK 开源，引擎云服务	部分开源	开源
维护状态	活跃（1645+ commits）	活跃	活跃

选择建议：

选 supermemory：需要开箱即用的完整记忆方案，重视 benchmark 性能，接受云服务
选 Mem0：需要本地部署 + 知识图谱能力，对数据主权要求高
选 Zep：需要时序知识图谱，适合合规审计等需要”双时态”的场景
选 OMEGA/Letta：需要完全本地、零外部依赖的方案

生态 & 社区

维护状态：非常活跃，1645+ commits，持续更新中
文档质量：好，有完整的 Quickstart、API Reference、Concepts 文档、Cookbook
周边生态：
- MCP Server（Claude Desktop/Cursor/Windsurf/VS Code）
- Vercel AI SDK 集成
- LangChain/LangGraph 集成
- OpenAI Agents SDK 集成
- Mastra/Agno/n8n 集成
社区活跃度：有 Discord 社区，GitHub Issues 响应及时

引入评估

维度	评分（/5）	备注
上手难度	⭐⭐⭐⭐⭐	单 API 调用，10 行代码集成
文档完善度	⭐⭐⭐⭐	文档清晰，有 Cookbook 和基准测试
社区活跃	⭐⭐⭐⭐	Discord + GitHub 活跃
性能	⭐⭐⭐⭐⭐	三大 benchmark #1，<300ms
稳定性	⭐⭐⭐⭐	云服务依赖是唯一风险
综合	⭐⭐⭐⭐

结论：推荐 — 如果你在构建需要长期记忆的 AI 应用，supermemory 是目前性能最好、上手最简单的方案。三大 benchmark #1 的成绩不是吹的，单 API 集成的设计也很务实。唯一需要考虑的是云服务依赖和数据主权问题。

推荐引入版本：latest（npm: supermemory，pypi: supermemory）

个人备注

{留白，供后续补充实际使用心得}