agentmemory
agentmemory offre une mémoire locale pour agents IA : capture les sessions, rappel rapide hybride et stockage JSON sur disque, sans bases externes.
Qu’est-ce qu’agentmemory ?
agentmemory est une « couche mémoire » locale pour agents IA de codage qui capture l’activité d’une session d’agent, puis fournit un rappel rapide pour les étapes suivantes. Il s’exécute sur votre machine en tant que processus Node unique et stocke l’état sur disque au format JSON, sans bases de données externes.
Le système capture les appels d’outils et les prompts via des hooks de capture automatique, consolide les observations brutes en mémoires sémantiques, et propose une récupération via un pipeline hybride (BM25 + vecteur + graphe de connaissances) avec reranking sur l’appareil.
Fonctionnalités principales
- Exécution locale avec état JSON sur disque (zéro base externe) : Fonctionne comme un processus Node unique et persiste les données sur disque au format JSON ; il ne nécessite pas Redis, Kafka, Postgres, Qdrant ni Neo4j.
- Hooks de capture automatique pour l’activité de l’agent : PreToolUse, PostToolUse, SessionStart, Stop et d’autres événements alimentent le pipeline mémoire sans code supplémentaire une fois installé.
- Récupération hybride avec reranking sur l’appareil : La récupération en triple flux combine les signaux BM25, vecteur et graphe de connaissances et reranke les résultats sur l’appareil (décrit comme « P50 sous 20 ms sur un portable » sur la page).
- Comportement d’auto-consolidation et de rétention : Des balayages horaires consolident les observations brutes en mémoires sémantiques, fusionnent les doublons, décayent les lignes périmées avec un score de rétention, et émettent des lignes d’audit en batch lorsque des éléments sont删除.
- MCP server avec une surface d’outils définie : Expose les MCP tools tels que
memory_save,memory_recall,memory_smart_search,memory_sessions,governance,auditetexport, ainsi que un REST twin pour chaque MCP tool sous/agentmemory/*. - Replay de session via import JSONL : Rehydrate une session à partir d’un transcript JSONL de Claude Code,包括 observations, tool uses et timeline, dans le store.
- Compression et querying du graphe de connaissances : Extrait les entités et relations pendant la compression ; supporte le querying du graphe via
/agentmemory/graphet la visualisation dans le viewer. - Sync fédéré entre nodes (HTTPS authentifié) : Push/pull memories entre nodes agentmemory avec authentification bearer-token ; la page indique explicitement « no silent syncs. »
- Local viewer et sortie d’observabilité : Fournit un live observation stream viewer (port 3113) et logs/traces via un « OTEL observability worker » (OTLP export pour tracing backends tels que Jaeger/Honeycomb/Tempo mentionnés sur la page).
Comment utiliser agentmemory
- Installer une fois : Exécutez
npm install -g @agentmemory/agentmemorypour mettreagentmemorysur votre PATH. - Lancer le serveur : Lancez
agentmemory(server runs on:3111, viewer on:3113). - Vérifier en local : Ouvrez
http://localhost:3113pour voir le live observation stream et les dashboards. - Connecter un agent via MCP : Configurez votre agent pour utiliser la MCP JSON configuration de agentmemory (le site indique « one MCP JSON fits almost everything »).
- Importer des sessions passées (optionnel) : Utilisez la JSONL session import capability pour replay des agent runs antérieurs dans le store.
Cas d’usage
- Construire une continuité entre plusieurs sessions de codage : Capture chaque session’s prompts et tool usage pour que later agent actions puissent retrieve relevant past observations rapidement.
- Support de l’audit « pourquoi l’agent a-t-il fait cela ? » : Utilisez l’audit emission pour les deletes et l’observability/tracing output pour inspecter ce happened durant les memory operations et session handling.
- Améliorer la qualité de la retrieval pour des queries mixtes : Utilisez la hybrid search (BM25 + vector + knowledge graph) avec on-device reranking quand les queries sont partly lexical, partly semantic, ou dépendent de extracted relations.
- Transformer des transcripts en mémoire réutilisable : Import Claude Code JSONL transcripts pour rehydrate un full session timeline—useful quand vous avez past runs que vous want to query later.
- Coordonner entre plusieurs machines d’agent : Set up peer-to-peer sync entre agentmemory nodes avec authenticated HTTPS pour push/pull memory exchange.
FAQ
-
agentmemory nécessite-t-il une base de données externe (comme Postgres ou Qdrant) ? Non. La page indique « ZÉRO BASES DE DONNÉES EXTERNES » et décrit le système comme un processus unique dont l’état est stocké sur disque au format JSON.
-
Comment accéder aux outils d’enregistrement et de rappel de mémoire ? agentmemory expose un serveur MCP avec des outils tels que
memory_saveetmemory_recall. La page mentionne également des points de terminaison REST pour chaque outil sous/agentmemory/*. -
Où puis-je voir ce que le serveur capture ? Un visualiseur démarre automatiquement sur le port 3113, affichant le flux d’observations en direct, l’explorateur de sessions, le navigateur de mémoire, la visualisation du graphe de connaissances et un tableau de bord de santé.
-
Puis-je importer des transcriptions de codage existantes ? Oui. La page décrit un workflow d’import JSONL qui ingère une transcription Claude Code JSONL et réhydrate les observations, les utilisations d’outils et la chronologie.
-
agentmemory prend-il en charge le déplacement des données de mémoire entre machines ? La page décrit une synchronisation pair-à-pair via HTTPS authentifié avec jetons porteurs (et sans synchronisations silencieuses).
Alternatives
- Bases de données vectorielles générales + couche mémoire agent personnalisée : Vous pouvez stocker des embeddings et implémenter la récupération,但 vous devez gérer l’orchestration, la consolidation, les hooks et la gestion des sessions/chronologies — contrairement à l’auto-capture + surface MCP/REST décrite pour agentmemory.
- Outils de base de connaissances locale pour l’historique du code (systèmes de type note/graphe) : Les outils qui indexent des documents et offrent des vues de recherche/graphe peuvent aider pour le rappel, mais ils ne capturent pas directement les appels d’outils agent et les événements de session via le pipeline de hooks décrit ici.
- Cadres RAG sans auto-capture agent-spécifique : De nombreux stacks RAG offrent la récupération et l’assemblage de contexte à la génération, mais nécessitent souvent une intégration plus personnalisée pour capturer les événements SessionStart/Stop et les utilisations d’outils dans un modèle de mémoire récupérable.
- Configurations de télémétrie/observabilité agent uniquement : Les outils de traçage peuvent aider à inspecter le comportement, mais ils ne fournissent généralement pas la consolidation de mémoire, les points de terminaison de récupération et le workflow d’import de relecture décrit pour agentmemory.
Alternatives
Falconer
Falconer est une plateforme de connaissances qui se met à jour automatiquement pour équipes rapides : écrivez, partagez et trouvez une documentation interne fiable.
skills-janitor
skills-janitor audite, suit l’usage et compare vos compétences Claude Code avec neuf actions d’analyse par commandes slash, sans dépendances.
Lasso
Lasso est un PIM orienté IA pour équipes e-commerce : enrichit attributs et descriptions, traite les données fournisseurs et suit les concurrents via app ou API.
Codex Plugins
Utilisez Codex Plugins pour regrouper des skills, intégrations d’app et serveurs MCP en workflows réutilisables afin d’étendre l’accès à Gmail, Google Drive et Slack.
Struere
Struere est un système opérationnel natif AI qui remplace les workflows Excel par des logiciels structurés : tableaux de bord, alertes et automatisations.
garden-md
Transformez des transcriptions de réunion en wiki d’entreprise structuré et lié, via des fichiers markdown locaux et une vue HTML, avec synchronisation.