UStackUStack
DeltaMemory favicon

DeltaMemory

DeltaMemory ist die kognitive Speicherschicht-Infrastruktur, die Produktions-KI-Agenten dauerhafte Erinnerungsfähigkeit, automatische Faktenextraktion und sich selbst verstärkende kontextuelle Intelligenz verleiht.

Was ist DeltaMemory?

Was ist DeltaMemory?

DeltaMemory dient als die wesentliche kognitive Speicherschicht für KI-Agenten in Produktionsqualität und löst das kritische Problem des Agenten-Vergessens. Herkömmliche KI-Agenten haben Schwierigkeiten, den Kontext über lange Zeiträume aufrechtzuerhalten oder sich an vergangene Interaktionen genau zu erinnern, was zu repetitiven Gesprächen und beeinträchtigter Leistung führt. DeltaMemory behebt dies, indem es eine dauerhafte, strukturierte Abrufbarkeit bereitstellt, die es Agenten ermöglicht, dynamisch auf früheres Wissen aufzubauen. Es fungiert als die Infrastrukturschicht, die sicherstellt, dass jede Interaktion zu einer wachsenden, zugänglichen Wissensbasis beiträgt und so die Genauigkeit und Effizienz des Agenten in realen Anwendungen erheblich steigert.

Diese Plattform ist auf Leistung und Skalierbarkeit ausgelegt und weist branchenführende Benchmarks bei der Abrufgeschwindigkeit und Kostensenkung auf. Durch die automatische Extraktion strukturierter Fakten und den Aufbau von Wissensgraphen aus Rohgesprächs-Protokollen erreicht DeltaMemory eine massive Token-Kompression (bis zu 3.714x), was bedeutet, dass Agenten sich nur an das erinnern, was wichtig ist, ohne den Rechenaufwand der erneuten Verarbeitung ganzer Historien. Dies führt zu einem 2x schnelleren Abruf, 97 % niedrigeren Kosten im Vergleich zur erneuten Verarbeitung von Roh-Tokens und einer überlegenen Leistung bei Langzeit-Konversations-Benchmarks wie LoCoMo.

Schlüsselfunktionen

  • Dauerhafte Erinnerung & Kontextuelle Intelligenz: Agenten behalten das Langzeitgedächtnis über Sitzungen hinweg bei, was personalisierte und kontextbewusste Interaktionen ermöglicht, die sich im Laufe der Zeit verstärken.
  • Automatische Faktenextraktion & Wissensgraphen: Rohgesprächsdaten werden automatisch in strukturierte Fakten und miteinander verbundene Wissensgraphen umgewandelt, was einen effizienten, semantischen Abruf ermöglicht.
  • Extreme Token-Kompression: Erreicht bis zu 3.714x Kompression durch Strukturierung der Daten, wodurch die für den Abruf erforderliche Kontextfenstergröße drastisch reduziert wird und erhebliche Kosteneinsparungen (97 % Reduzierung) erzielt werden.
  • Hohe Leistung & Geringe Latenz: Liefert 50 ms p50 Abfrage-Latenz, angetrieben von einer Rust-basierten Engine, was eine Echtzeit-Reaktionsfähigkeit für Produktionssysteme gewährleistet.
  • Framework-Native Integration: Bietet erstklassige SDK-Unterstützung für beliebte Agenten-Frameworks, einschließlich Vercel AI SDK, LangChain, CrewAI und n8n, was eine schnelle Integration ermöglicht.
  • Eingebaute Beobachtbarkeit & Rückverfolgbarkeit: Jeder Speicherbetrieb wird vollständig nachverfolgt und bietet Einblicke in extrahierte Fakten, abgerufene Erinnerungen und Salienz-Scores für robuste Fehlersuche und Audits.
  • Enterprise-Tauglichkeit: Entwickelt für Produktionsumgebungen mit SOC 2-Compliance-Bereitschaft, HIPAA-Bereitschaft, Audit-fähiger Sicherheit und einem 99,9 % Uptime SLA.
  • Flexible Bereitstellung: Unterstützt die Bereitstellung als verwalteter Cloud-Dienst oder On-Premise innerhalb Ihrer eigenen VPC, um die Datenhoheit und Kontrolle zu gewährleisten.

Verwendung von DeltaMemory

Die Integration von DeltaMemory in einen bestehenden KI-Agenten-Stack ist schnell und unkompliziert und erfordert minimalen technischen Aufwand.

  1. SDK installieren: Beginnen Sie mit der Installation des DeltaMemory SDK in Ihrer Anwendungsumgebung.
  2. Verbindung initialisieren: Instanziieren Sie den DeltaMemory-Client und verbinden Sie ihn mit Ihrer DeltaMemory-Instanz (z. B. Angabe der Host-Adresse).
  3. Daten aufnehmen (Ingest): Verwenden Sie die ingest-Methode und übergeben Sie eine eindeutige Benutzerkennung sowie die neue Nachricht oder den neuen Datenpunkt. DeltaMemory übernimmt die Verarbeitung, Faktenextraktion und Kompression automatisch im Hintergrund.
  4. Informationen abrufen (Recall): Wenn der Agent Kontext benötigt, verwenden Sie die recall-Methode mit der Benutzer-ID. Das System ruft sofort die relevantesten, komprimierten Erinnerungen und strukturierten Fakten ab.
  5. Framework-Integration: Für bestehende Agenten-Workflows (wie LangChain Chains) fügen Sie den DeltaMemory-Konnektor in den vorhandenen Speicherkonfigurations-Slot ein. Dies erfordert oft nur wenige Codezeilen, um ältere, weniger effiziente Speicherlösungen auszutauschen.

Anwendungsfälle

DeltaMemory bietet sich selbst verstärkende Intelligenz in jedem Szenario, in dem KI-Agenten wiederholt mit Benutzern oder Daten interagieren:

  • Gesundheitswesen (Medizinische KI-Assistenten): Medizinische KI-Assistenten können einen dauerhaften, konformen Datensatz der Patientenhistorie, Medikamentenwechselwirkungen und geäußerten Präferenzen über mehrere Sitzungen hinweg pflegen. Beispielsweise erinnert sich ein Therapie-Chatbot an spezifische Angstauslöser, die drei Sitzungen zuvor erwähnt wurden, wodurch der Patient davon befreit wird, sensible Informationen wiederholen zu müssen.
  • Bildung (Personalisierte Tutoren): KI-Tutoren nutzen das angesammelte Verständnis einzelner Schüler. Das System verfolgt den Lernfortschritt, identifiziert anhaltende Wissenslücken (z. B. Schwierigkeiten mit quadratischen Gleichungen) und passt den Lehrstil und das Schwierigkeitsniveau in nachfolgenden Lektionen automatisch an.
  • E-Commerce (Hyper-personalisierter Einkauf): Einkaufsassistenten erstellen tiefe Präferenzprofile aus jeder Interaktion. Wenn ein Kunde einmal eine Präferenz für nachhaltige Marken und Größe M erwähnt, behält der Agent dies bei und stellt sicher, dass alle zukünftigen Empfehlungen relevant sind, ohne dass eine wiederholte Aufforderung erforderlich ist.
  • Kundensupport (Kontextbewusste Agenten): Support-Agenten erhalten sofortigen Zugriff auf die vollständige Historie jeder Kundeninteraktion, einschließlich früherer Tickets, Präferenzen und vorheriger Lösungspfade. Dieser Kontext wird bei Eskalationen mitgeführt, was eine Lösung beim Erstkontakt ermöglicht, ohne dass der Kunde sein Problem erneut darlegen muss.
  • Vertriebsintelligenz: Vertriebs-KI verfolgt Interaktionen mit Interessenten, Einwände und Kaufsignale über verschiedene Kontaktpunkte hinweg (E-Mail, Chat). Jede Nachverfolgung basiert auf der vollständigen Beziehungsgeschichte, sodass der Agent budgetbezogene Nachverfolgungen perfekt auf der Grundlage früherer Diskussionen timen kann.

FAQ

F: Wie erreicht DeltaMemory eine solch hohe Token-Kompression? A: Wir gehen über einfache Vektor-Embeddings hinaus. DeltaMemory analysiert Rohgesprächs-Protokolle, um automatisch strukturierte Fakten zu extrahieren und einen semantischen Wissensgraphen aufzubauen. Diese strukturierte Darstellung ist weitaus effizienter als die Speicherung von Roh-Text oder sogar dichten Embeddings, was uns ermöglicht, Millionen von Tokens in einige tausend relevante Datenpunkte zu komprimieren.

F: Ist DeltaMemory mit meinem aktuellen LLM oder Framework kompatibel? A: Ja. DeltaMemory ist im Kern Framework-agnostisch, bietet jedoch erstklassige, native Integrationen mit beliebten Tools wie LangChain, CrewAI und dem Vercel AI SDK. Da es als dedizierte Speicherschicht fungiert, kann es mit praktisch jedem LLM-Anbieter integriert werden.

F: Welche Sicherheits- und Compliance-Standards erfüllt DeltaMemory für den Unternehmenseinsatz? A: DeltaMemory wurde mit Blick auf Unternehmensanforderungen entwickelt und bietet SOC 2-Compliance-Bereitschaft und HIPAA-Bereitschaft, die in die Architektur integriert sind. Wir bieten kryptografisches Eigentum an Speicher-Graphen und granulare Zustimmungssteuerungen, um die Datensicherheit zu gewährleisten, unabhängig davon, ob die Bereitstellung in der Cloud oder On-Premise erfolgt.

F: Was ist der Unterschied zwischen DeltaMemory und Standard-Vektordatenbanken? A: Standard-Vektordatenbanken speichern hauptsächlich Embeddings von Roh-Text und erfordern, dass der gesamte Kontext neu eingebettet und durchsucht wird. DeltaMemory extrahiert die Bedeutung in strukturierte Fakten und Graphen, was zu einem schnelleren, präziseren Abruf (validiert durch LoCoMo-Benchmarks) und drastisch niedrigeren Betriebskosten aufgrund minimaler erneuter Verarbeitung führt.

F: Kann ich DeltaMemory in meiner eigenen privaten Cloud oder VPC bereitstellen? A: Absolut. DeltaMemory bietet volle Bereitstellungsflexibilität. Sie können unseren verwalteten Cloud-Dienst nutzen oder DeltaMemory On-Premise innerhalb Ihrer eigenen Virtual Private Cloud (VPC) bereitstellen, um die vollständige Kontrolle über Ihre Datenresidenz und Sicherheitsposition zu behalten.

DeltaMemory | UStack