UStackUStack
DeltaMemory favicon

DeltaMemory

DeltaMemory 是一種認知記憶層基礎設施,旨在為生產級 AI 代理提供持久記憶、自動事實提取和複合式情境智慧。

什麼是 DeltaMemory?

什麼是 DeltaMemory?

DeltaMemory 作為生產級 AI 代理的關鍵認知記憶層,解決了代理遺忘問題這一核心痛點。傳統的 AI 代理難以在長時間內準確維持情境或回憶過去的互動,這會導致對話重複和效能下降。DeltaMemory 通過提供持久化、結構化的記憶檢索來解決此問題,使代理能夠動態地建立在過去的知識之上。它充當基礎設施層,確保每一次互動都有助於建立一個不斷增長、可存取的知識庫,從而顯著提高代理在現實世界應用中的準確性和效率。

該平台專為效能和規模而設計,在檢索速度和成本節約方面創下業界領先基準。通過自動從原始對話日誌中提取結構化事實並構建知識圖譜,DeltaMemory 實現了驚人的標記壓縮(高達 3,714 倍),這意味著代理只會回憶重要的內容,而無需重新處理整個歷史記錄所帶來的高額計算開銷。這使得檢索速度快 2 倍,與原始標記重新處理相比成本降低 97%,並且在 LoCoMo 等長期對話基準測試中表現更優異。

關鍵功能

  • 持久記憶與情境智慧: 代理可以在不同會話中保持長期記憶,從而實現隨著時間推移而不斷累積的個人化和具情境感知能力的互動。
  • 自動事實提取與知識圖譜: 原始對話數據會自動轉換為結構化事實和相互關聯的知識圖譜,從而實現高效的語義檢索。
  • 極致標記壓縮: 通過結構化數據,實現高達 3,714 倍的壓縮率,大幅減少記憶檢索所需的情境視窗大小,從而帶來顯著的成本節約(降低 97%)。
  • 高效能與低延遲: 由基於 Rust 的引擎驅動,提供 50 毫秒的 p50 查詢延遲,確保生產系統的即時響應能力。
  • 框架原生整合: 為流行的代理框架(包括 Vercel AI SDK、LangChain、CrewAI 和 n8n)提供一流的 SDK 支援,實現快速整合。
  • 內建可觀測性與可追溯性: 每一次記憶操作都經過完整追蹤,提供關於提取的事實、檢索到的記憶和顯著性分數的可視性,以便進行穩健的除錯和審計。
  • 企業就緒: 專為生產環境設計,具備 SOC 2 合規準備度、HIPAA 合規準備度、審計級安全性和 99.9% 的正常運行時間 SLA。
  • 靈活部署: 支援作為託管雲服務部署,或在您自己的 VPC 內部署,確保數據主權和控制權。

如何使用 DeltaMemory

將 DeltaMemory 整合到現有的 AI 代理堆棧中,設計上力求快速且直接,只需最少的工程投入。

  1. 安裝 SDK: 首先在您的應用程式環境中安裝 DeltaMemory SDK。
  2. 初始化連線: 實例化 DeltaMemory 客戶端,將其連接到您的 DeltaMemory 實例(例如,指定主機位址)。
  3. 資料攝取: 使用 ingest 方法,傳入唯一的用戶識別碼和新的訊息或數據點。DeltaMemory 會自動在背景處理、提取事實和進行壓縮。
  4. 檢索資訊: 當代理需要情境時,使用帶有用戶 ID 的 recall 方法。系統會立即檢索最相關、經過壓縮的記憶和結構化事實。
  5. 框架整合: 對於現有的代理工作流程(如 LangChain 鏈),將 DeltaMemory 連接器放入現有的記憶配置插槽中,通常只需幾行程式碼即可替換掉較舊、效率較低的記憶解決方案。

使用案例

在任何 AI 代理需要與用戶或數據重複互動的場景中,DeltaMemory 都能提供不斷增長的智慧:

  • 醫療保健(醫療 AI 助理): 醫療 AI 助理可以在多次會話中維護患者病史、藥物相互作用和陳述偏好的持久、合規記錄。例如,治療聊天機器人可以回憶起三個會話前提到的特定焦慮觸發因素,從而省去患者重複敏感資訊的需要。
  • 教育(個人化導師): AI 導師利用對個別學生的累積理解。系統會追蹤學習進度,識別持續存在的知識差距(例如,在二次方程上的困難),並在後續課程中自動調整教學風格和難度級別。
  • 電子商務(超個人化購物): 購物助理從每一次互動中建立深入的偏好檔案。如果客戶只提及一次偏好永續品牌和 M 尺寸,代理會記住這一點,確保所有未來的推薦都是相關的,而無需重複提示。
  • 客戶支援(具情境感知能力的代理): 支援代理可以即時存取每位客戶互動的完整歷史記錄,包括過去的工單、偏好和先前的解決方案路徑。此情境會隨升級傳遞,允許首次聯絡解決問題,而無需要求客戶重述他們的問題。
  • 銷售情報: 銷售 AI 會追蹤潛在客戶在各種接觸點(電子郵件、聊天)的互動、異議和購買訊號。每一次後續跟進都以完整的關係歷史為依據,允許代理根據先前的討論完美安排預算相關的跟進時機。

常見問題 (FAQ)

問:DeltaMemory 如何實現如此高的標記壓縮率? 答:我們超越了簡單的向量嵌入。DeltaMemory 會分析原始對話日誌,以自動提取結構化事實並構建語義知識圖譜。這種結構化表示比儲存原始文本甚至密集嵌入更有效率,允許我們將數百萬個標記壓縮成數千個相關數據點。

問:DeltaMemory 是否與我目前的 LLM 或框架相容? 答:是的。DeltaMemory 在核心上是框架不可知論的,但為 LangChain、CrewAI 和 Vercel AI SDK 等流行工具提供一流的原生整合。由於它作為專用的記憶層運行,它可以與幾乎任何 LLM 提供商整合。

問:DeltaMemory 滿足企業使用的安全和合規標準是什麼? 答:DeltaMemory 在架構中內建了企業級要求,提供 SOC 2 合規準備度和 HIPAA 合規準備度。我們為記憶圖譜提供密碼學所有權和精細的同意控制,無論是在雲端還是本地部署,都能確保數據安全。

問:DeltaMemory 與標準向量資料庫有何不同? 答:標準向量資料庫主要儲存原始文本的嵌入,需要對整個情境進行重新嵌入和搜尋。DeltaMemory 將意義提取到結構化事實和圖譜中,從而實現更快、更精確的檢索(經 LoCoMo 基準測試驗證),並由於重新處理最少,營運成本大大降低。

問:我可以在自己的私有雲或 VPC 中部署 DeltaMemory 嗎? 答:絕對可以。DeltaMemory 提供完全的部署靈活性。您可以使用我們的託管雲服務,或在您自己的虛擬私人雲 (VPC) 內部署 DeltaMemory,以保持對數據駐留和安全態勢的完全控制。

DeltaMemory | UStack