UStackUStack
DeltaMemory favicon

DeltaMemory

DeltaMemory est l'infrastructure de couche de mémoire cognitive conçue pour doter les agents IA de production d'un rappel persistant, d'une extraction automatique de faits et d'une intelligence contextuelle cumulative.

Qu'est-ce que DeltaMemory ?

Qu'est-ce que DeltaMemory ?

DeltaMemory sert de couche de mémoire cognitive essentielle pour les agents IA de qualité production, résolvant le problème critique de l'oubli des agents. Les agents IA traditionnels ont du mal à maintenir le contexte ou à se souvenir avec précision des interactions passées sur de longues périodes, ce qui entraîne des conversations répétitives et une dégradation des performances. DeltaMemory corrige cela en fournissant un rappel persistant et structuré, permettant aux agents de s'appuyer dynamiquement sur les connaissances acquises. Il agit comme la couche d'infrastructure, garantissant que chaque interaction contribue à une base de connaissances croissante et accessible, améliorant considérablement la précision et l'efficacité des agents dans les applications du monde réel.

Cette plateforme est conçue pour la performance et l'évolutivité, affichant des références de pointe en matière de vitesse de récupération et de réduction des coûts. En extrayant automatiquement des faits structurés et en construisant des graphes de connaissances à partir des journaux de conversation bruts, DeltaMemory réalise une compression massive de jetons (jusqu'à 3 714 fois), ce qui signifie que les agents ne se souviennent que de ce qui est pertinent, sans la surcharge informatique liée au retraitement des historiques complets. Il en résulte une récupération 2 fois plus rapide, des coûts 97 % inférieurs par rapport au retraitement des jetons bruts, et des performances supérieures sur les benchmarks de conversation à long terme comme LoCoMo.

Fonctionnalités Clés

  • Rappel Persistant et Intelligence Contextuelle : Les agents maintiennent une mémoire à long terme entre les sessions, permettant des interactions personnalisées et sensibles au contexte qui se cumulent avec le temps.
  • Extraction Automatique de Faits et Graphes de Connaissances : Les données de conversation brutes sont automatiquement transformées en faits structurés et en graphes de connaissances interconnectés, permettant une récupération sémantique efficace.
  • Compression de Jetons Extrême : Atteint jusqu'à 3 714x de compression en structurant les données, réduisant considérablement la taille de la fenêtre de contexte nécessaire pour le rappel et entraînant des économies de coûts significatives (réduction de 97 %).
  • Haute Performance et Faible Latence : Offre une latence de requête p50 de 50 ms, alimentée par un moteur basé sur Rust, assurant une réactivité en temps réel pour les systèmes de production.
  • Intégration Native aux Frameworks : Propose un support SDK de première classe pour les frameworks d'agents populaires, notamment Vercel AI SDK, LangChain, CrewAI et n8n, permettant une intégration rapide.
  • Observabilité et Traçabilité Intégrées : Chaque opération de mémoire est entièrement tracée, offrant une visibilité sur les faits extraits, les souvenirs rappelés et les scores de saillance pour un débogage et une auditabilité robustes.
  • Prêt pour l'Entreprise : Conçu pour les environnements de production avec une préparation à la conformité SOC 2, une préparation HIPAA, une sécurité de niveau audit et un SLA de disponibilité de 99,9 %.
  • Déploiement Flexible : Prend en charge le déploiement en tant que service cloud géré ou sur site au sein de votre propre VPC, assurant la souveraineté et le contrôle des données.

Comment Utiliser DeltaMemory

L'intégration de DeltaMemory dans une pile d'agents IA existante est conçue pour être rapide et simple, nécessitant un effort d'ingénierie minimal.

  1. Installer le SDK : Commencez par installer le SDK DeltaMemory dans votre environnement d'application.
  2. Initialiser la Connexion : Instanciez le client DeltaMemory, en le connectant à votre instance DeltaMemory (par exemple, en spécifiant l'adresse de l'hôte).
  3. Ingérer les Données : Utilisez la méthode ingest, en fournissant un identifiant utilisateur unique et le nouveau message ou point de données. DeltaMemory gère automatiquement le traitement, l'extraction des faits et la compression en arrière-plan.
  4. Rappeler l'Information : Lorsque l'agent a besoin de contexte, utilisez la méthode recall avec l'ID utilisateur. Le système récupère instantanément les souvenirs compressés et les faits structurés les plus pertinents.
  5. Intégration au Framework : Pour les flux de travail d'agents existants (comme les chaînes LangChain), insérez le connecteur DeltaMemory dans l'emplacement de configuration de mémoire existant, nécessitant souvent seulement quelques lignes de code pour remplacer les solutions de mémoire plus anciennes et moins efficaces.

Cas d'Utilisation

DeltaMemory fournit une intelligence cumulative dans tous les scénarios où les agents IA interagissent de manière répétée avec des utilisateurs ou des données :

  • Santé (Assistants IA Médicaux) : Les assistants IA médicaux peuvent maintenir un dossier persistant et conforme de l'historique du patient, des interactions médicamenteuses et des préférences exprimées au cours de plusieurs sessions. Par exemple, un chatbot thérapeutique se souvient de déclencheurs d'anxiété spécifiques mentionnés trois sessions auparavant, évitant au patient de répéter des informations sensibles.
  • Éducation (Tuteurs Personnalisés) : Les tuteurs IA tirent parti de la compréhension accumulée des étudiants individuels. Le système suit les progrès d'apprentissage, identifie les lacunes persistantes en matière de connaissances (par exemple, les difficultés avec les équations quadratiques) et adapte automatiquement le style d'enseignement et le niveau de difficulté lors des leçons suivantes.
  • E-commerce (Achats Hyper-Personnalisés) : Les assistants d'achat construisent des profils de préférences approfondis à partir de chaque interaction. Si un client mentionne une préférence pour les marques durables et la taille M une seule fois, l'agent s'en souvient, garantissant que toutes les recommandations futures sont pertinentes sans nécessiter de nouvelles invites.
  • Support Client (Agents Sensibles au Contexte) : Les agents de support ont un accès instantané à l'historique complet de chaque interaction client, y compris les tickets précédents, les préférences et les chemins de résolution antérieurs. Ce contexte accompagne les escalades, permettant une résolution au premier contact sans demander au client de réitérer son problème.
  • Intelligence Commerciale : L'IA commerciale suit les interactions avec les prospects, les objections et les signaux d'achat à travers divers points de contact (e-mail, chat). Chaque suivi est informé par l'historique complet de la relation, permettant à l'agent de planifier parfaitement les suivis liés au budget en fonction des discussions précédentes.

FAQ

Q : Comment DeltaMemory atteint-il une compression de jetons aussi élevée ? A : Nous allons au-delà des simples plongements vectoriels (embeddings). DeltaMemory analyse les journaux de conversation bruts pour extraire automatiquement des faits structurés et construire un graphe de connaissances sémantique. Cette représentation structurée est bien plus efficace que le stockage de texte brut ou même d'embeddings denses, nous permettant de compresser des millions de jetons en quelques milliers de points de données pertinents.

Q : DeltaMemory est-il compatible avec mon LLM ou framework actuel ? R : Oui. DeltaMemory est fondamentalement indépendant du framework, mais offre des intégrations natives de première classe avec des outils populaires comme LangChain, CrewAI et Vercel AI SDK. Puisqu'il fonctionne comme une couche de mémoire dédiée, il peut être intégré avec pratiquement n'importe quel fournisseur de LLM.

Q : Quelles normes de sécurité et de conformité DeltaMemory respecte-t-il pour une utilisation en entreprise ? R : DeltaMemory est conçu en tenant compte des exigences de l'entreprise, offrant une préparation à la conformité SOC 2 et une préparation HIPAA intégrées à l'architecture. Nous fournissons une propriété cryptographique des graphes de mémoire et des contrôles de consentement granulaires, assurant la sécurité des données, que le déploiement soit dans le cloud ou sur site.

Q : Quelle est la différence entre DeltaMemory et les bases de données vectorielles standard ? R : Les bases de données vectorielles standard stockent principalement des embeddings de texte brut, nécessitant que le contexte entier soit ré-encodé et recherché. DeltaMemory extrait le sens dans des faits structurés et des graphes, conduisant à une récupération plus rapide et plus précise (validée par les benchmarks LoCoMo) et à des coûts opérationnels considérablement réduits grâce au retraitement minimal.

Q : Puis-je déployer DeltaMemory au sein de mon propre cloud privé ou VPC ? R : Absolument. DeltaMemory offre une flexibilité de déploiement totale. Vous pouvez utiliser notre service cloud géré, ou déployer DeltaMemory sur site au sein de votre propre Cloud Privé Virtuel (VPC) pour maintenir un contrôle total sur la résidence et la posture de sécurité de vos données.