UStackUStack
DeltaMemory favicon

DeltaMemory

DeltaMemory 是专为生产级 AI 智能体设计的认知记忆层基础设施,旨在提供持久的记忆、自动化的事实提取和复合式上下文智能。

什么是 DeltaMemory?

什么是 DeltaMemory?

DeltaMemory 充当生产级 AI 智能体的核心认知记忆层,解决了智能体遗忘的关键问题。传统的 AI 智能体难以在长时间内保持上下文或准确回忆过去的交互,这会导致重复的对话和性能下降。DeltaMemory 通过提供持久化、结构化的记忆检索来解决这个问题,使智能体能够动态地建立在过去的知识之上。它充当基础设施层,确保每一次交互都为不断增长、可访问的知识库做出贡献,从而显著提高智能体在实际应用中的准确性和效率。

该平台专为性能和规模而设计,在检索速度和成本削减方面保持行业领先基准。通过自动从原始对话日志中提取结构化事实并构建知识图谱,DeltaMemory 实现了巨大的 Token 压缩(高达 3,714 倍),这意味着智能体只回忆重要信息,而无需重新处理整个历史记录带来的计算开销。这使得检索速度提高 2 倍,与原始 Token 重新处理相比,成本降低了 97%,并且在 LoCoMo 等长期对话基准测试中表现更优异。

核心特性

  • 持久记忆与上下文智能: 智能体在不同会话中保持长期记忆,支持随着时间推移而不断积累的个性化和上下文感知的交互。
  • 自动事实提取与知识图谱: 原始对话数据会自动转换为结构化事实和相互关联的知识图谱,从而实现高效的语义检索。
  • 极端的 Token 压缩: 通过结构化数据,实现高达 3,714 倍的压缩率,大幅减少回忆所需的上下文窗口大小,带来显著的成本节约(降低 97%)。
  • 高性能与低延迟: 基于 Rust 引擎驱动,提供 50ms 的 p50 查询延迟,确保生产系统的实时响应能力。
  • 框架原生集成: 为流行的智能体框架(包括 Vercel AI SDK、LangChain、CrewAI 和 n8n)提供一流的 SDK 支持,可快速集成。
  • 内置可观测性与可追溯性: 每次记忆操作都经过完全追踪,提供关于提取的事实、回忆起的记忆和显著性分数的可见性,便于进行稳健的调试和审计。
  • 企业就绪性: 专为生产环境设计,具备 SOC 2 合规准备、HIPAA 合规准备、审计级别的安全性和 99.9% 的正常运行时间 SLA。
  • 灵活部署: 支持作为托管云服务或在您自己的 VPC 内进行本地部署,确保数据主权和控制权。

如何使用 DeltaMemory

将 DeltaMemory 集成到现有 AI 智能体堆栈中的过程设计得快速而直接,只需最少的工程投入。

  1. 安装 SDK: 首先在您的应用程序环境中安装 DeltaMemory SDK。
  2. 初始化连接: 实例化 DeltaMemory 客户端,将其连接到您的 DeltaMemory 实例(例如,指定主机地址)。
  3. 摄取数据: 使用 ingest 方法,传入唯一的用户标识符和新的消息或数据点。DeltaMemory 会在后台自动处理处理、事实提取和压缩。
  4. 回忆信息: 当智能体需要上下文时,使用带有用户 ID 的 recall 方法。系统会即时检索最相关、经过压缩的记忆和结构化事实。
  5. 框架集成: 对于现有的智能体工作流程(如 LangChain 链),只需将 DeltaMemory 连接器插入到现有的记忆配置插槽中,通常只需几行代码即可替换掉更旧、效率更低的记忆解决方案。

使用场景

在任何 AI 智能体需要与用户或数据反复交互的场景中,DeltaMemory 都能提供复合式智能:

  • 医疗保健(医疗 AI 助手): 医疗 AI 助手可以维护跨多个会话的患者病史、药物相互作用和陈述偏好的持久、合规记录。例如,治疗聊天机器人可以回忆起三个会话前提到的特定焦虑诱因,从而无需患者重复敏感信息。
  • 教育(个性化导师): AI 导师利用对个体学生的累积理解。系统会跟踪学习进度,识别持续存在的知识差距(例如,在二次方程上的困难),并在后续课程中自动调整教学风格和难度级别。
  • 电子商务(超个性化购物): 购物助手从每一次交互中建立深入的偏好档案。如果客户只提及一次偏爱可持续品牌和 M 码,智能体就会记住这一点,确保所有未来的推荐都相关,而无需重复提示。
  • 客户支持(上下文感知智能体): 支持智能体可以即时访问每个客户互动的完整历史记录,包括过去的工单、偏好和先前的解决方案路径。此上下文会随升级而传递,从而可以在首次联系时解决问题,而无需客户重述他们的问题。
  • 销售智能: 销售 AI 跟踪潜在客户在各种接触点(电子邮件、聊天)上的互动、异议和购买信号。每一次跟进都基于完整的关系历史记录,使智能体能够根据先前的讨论完美地安排与预算相关的跟进时间。

常见问题 (FAQ)

问:DeltaMemory 如何实现如此高的 Token 压缩率? 答:我们超越了简单的向量嵌入。DeltaMemory 会分析原始对话日志,以自动提取结构化事实并构建语义知识图谱。这种结构化表示比存储原始文本甚至密集嵌入更有效,使我们能够将数百万个 Token 压缩成几千个相关数据点。

问:DeltaMemory 与我当前的 LLM 或框架兼容吗? 答:是的。DeltaMemory 在核心上是框架无关的,但为 LangChain、CrewAI 和 Vercel AI SDK 等流行工具提供一流的原生集成。由于它充当专用的记忆层,它可以与几乎任何 LLM 提供商集成。

问:DeltaMemory 满足企业使用的安全和合规标准是什么? 答:DeltaMemory 在设计时就考虑了企业需求,架构中内置了 SOC 2 合规准备和 HIPAA 合规准备。我们提供记忆图谱的加密所有权和细粒度的同意控制,无论是在云端还是本地部署,都能确保数据安全。

问:DeltaMemory 与标准向量数据库有何不同? 答:标准向量数据库主要存储原始文本的嵌入,需要对整个上下文进行重新嵌入和搜索。DeltaMemory 将意义提取到结构化事实和图谱中,从而实现更快、更精确的检索(经 LoCoMo 基准测试验证),并由于重新处理最少,运营成本大大降低。

问:我可以在自己的私有云或 VPC 中部署 DeltaMemory 吗? 答:绝对可以。DeltaMemory 提供完全的部署灵活性。您可以使用我们的托管云服务,或在您自己的虚拟私有云 (VPC) 中本地部署 DeltaMemory,以保持对数据驻留和安全态势的完全控制。

DeltaMemory | UStack