什么是 DeltaMemory?
什么是 DeltaMemory?
DeltaMemory 充当生产级 AI 智能体的核心认知记忆层,解决了智能体遗忘的关键问题。传统的 AI 智能体难以在长时间内保持上下文或准确回忆过去的交互,这会导致重复的对话和性能下降。DeltaMemory 通过提供持久化、结构化的记忆检索来解决这个问题,使智能体能够动态地建立在过去的知识之上。它充当基础设施层,确保每一次交互都为不断增长、可访问的知识库做出贡献,从而显著提高智能体在实际应用中的准确性和效率。
该平台专为性能和规模而设计,在检索速度和成本削减方面保持行业领先基准。通过自动从原始对话日志中提取结构化事实并构建知识图谱,DeltaMemory 实现了巨大的 Token 压缩(高达 3,714 倍),这意味着智能体只回忆重要信息,而无需重新处理整个历史记录带来的计算开销。这使得检索速度提高 2 倍,与原始 Token 重新处理相比,成本降低了 97%,并且在 LoCoMo 等长期对话基准测试中表现更优异。
核心特性
- 持久记忆与上下文智能: 智能体在不同会话中保持长期记忆,支持随着时间推移而不断积累的个性化和上下文感知的交互。
- 自动事实提取与知识图谱: 原始对话数据会自动转换为结构化事实和相互关联的知识图谱,从而实现高效的语义检索。
- 极端的 Token 压缩: 通过结构化数据,实现高达 3,714 倍的压缩率,大幅减少回忆所需的上下文窗口大小,带来显著的成本节约(降低 97%)。
- 高性能与低延迟: 基于 Rust 引擎驱动,提供 50ms 的 p50 查询延迟,确保生产系统的实时响应能力。
- 框架原生集成: 为流行的智能体框架(包括 Vercel AI SDK、LangChain、CrewAI 和 n8n)提供一流的 SDK 支持,可快速集成。
- 内置可观测性与可追溯性: 每次记忆操作都经过完全追踪,提供关于提取的事实、回忆起的记忆和显著性分数的可见性,便于进行稳健的调试和审计。
- 企业就绪性: 专为生产环境设计,具备 SOC 2 合规准备、HIPAA 合规准备、审计级别的安全性和 99.9% 的正常运行时间 SLA。
- 灵活部署: 支持作为托管云服务或在您自己的 VPC 内进行本地部署,确保数据主权和控制权。
如何使用 DeltaMemory
将 DeltaMemory 集成到现有 AI 智能体堆栈中的过程设计得快速而直接,只需最少的工程投入。
- 安装 SDK: 首先在您的应用程序环境中安装 DeltaMemory SDK。
- 初始化连接: 实例化 DeltaMemory 客户端,将其连接到您的 DeltaMemory 实例(例如,指定主机地址)。
- 摄取数据: 使用
ingest方法,传入唯一的用户标识符和新的消息或数据点。DeltaMemory 会在后台自动处理处理、事实提取和压缩。 - 回忆信息: 当智能体需要上下文时,使用带有用户 ID 的
recall方法。系统会即时检索最相关、经过压缩的记忆和结构化事实。 - 框架集成: 对于现有的智能体工作流程(如 LangChain 链),只需将 DeltaMemory 连接器插入到现有的记忆配置插槽中,通常只需几行代码即可替换掉更旧、效率更低的记忆解决方案。
使用场景
在任何 AI 智能体需要与用户或数据反复交互的场景中,DeltaMemory 都能提供复合式智能:
- 医疗保健(医疗 AI 助手): 医疗 AI 助手可以维护跨多个会话的患者病史、药物相互作用和陈述偏好的持久、合规记录。例如,治疗聊天机器人可以回忆起三个会话前提到的特定焦虑诱因,从而无需患者重复敏感信息。
- 教育(个性化导师): AI 导师利用对个体学生的累积理解。系统会跟踪学习进度,识别持续存在的知识差距(例如,在二次方程上的困难),并在后续课程中自动调整教学风格和难度级别。
- 电子商务(超个性化购物): 购物助手从每一次交互中建立深入的偏好档案。如果客户只提及一次偏爱可持续品牌和 M 码,智能体就会记住这一点,确保所有未来的推荐都相关,而无需重复提示。
- 客户支持(上下文感知智能体): 支持智能体可以即时访问每个客户互动的完整历史记录,包括过去的工单、偏好和先前的解决方案路径。此上下文会随升级而传递,从而可以在首次联系时解决问题,而无需客户重述他们的问题。
- 销售智能: 销售 AI 跟踪潜在客户在各种接触点(电子邮件、聊天)上的互动、异议和购买信号。每一次跟进都基于完整的关系历史记录,使智能体能够根据先前的讨论完美地安排与预算相关的跟进时间。
常见问题 (FAQ)
问:DeltaMemory 如何实现如此高的 Token 压缩率? 答:我们超越了简单的向量嵌入。DeltaMemory 会分析原始对话日志,以自动提取结构化事实并构建语义知识图谱。这种结构化表示比存储原始文本甚至密集嵌入更有效,使我们能够将数百万个 Token 压缩成几千个相关数据点。
问:DeltaMemory 与我当前的 LLM 或框架兼容吗? 答:是的。DeltaMemory 在核心上是框架无关的,但为 LangChain、CrewAI 和 Vercel AI SDK 等流行工具提供一流的原生集成。由于它充当专用的记忆层,它可以与几乎任何 LLM 提供商集成。
问:DeltaMemory 满足企业使用的安全和合规标准是什么? 答:DeltaMemory 在设计时就考虑了企业需求,架构中内置了 SOC 2 合规准备和 HIPAA 合规准备。我们提供记忆图谱的加密所有权和细粒度的同意控制,无论是在云端还是本地部署,都能确保数据安全。
问:DeltaMemory 与标准向量数据库有何不同? 答:标准向量数据库主要存储原始文本的嵌入,需要对整个上下文进行重新嵌入和搜索。DeltaMemory 将意义提取到结构化事实和图谱中,从而实现更快、更精确的检索(经 LoCoMo 基准测试验证),并由于重新处理最少,运营成本大大降低。
问:我可以在自己的私有云或 VPC 中部署 DeltaMemory 吗? 答:绝对可以。DeltaMemory 提供完全的部署灵活性。您可以使用我们的托管云服务,或在您自己的虚拟私有云 (VPC) 中本地部署 DeltaMemory,以保持对数据驻留和安全态势的完全控制。
Alternatives
AakarDev AI
AakarDev AI 是一个强大的平台,通过无缝的向量数据库集成简化 AI 应用程序的开发,实现快速部署和可扩展性。
BookAI.chat
BookAI允许您通过简单提供书名和作者与您的书籍进行AI聊天。
LobeHub
LobeHub 是一个开源平台,旨在构建、部署和协作 AI 智能体队友,它充当通用的 LLM Web UI。
Claude Opus 4.5
介绍全球最佳的编码、代理、计算机使用和企业工作流程模型。
KiloClaw
KiloClaw 是一项完全托管的托管服务,用于部署流行的开源 AI 智能体 OpenClaw,从而消除了自托管基础设施和维护的复杂性。
Falconer
Falconer 是一个自更新的知识平台,旨在成为团队的单一事实来源,确保文档和内部知识保持准确且易于访问。