agentmemory

Qu’est-ce qu’agentmemory ?

agentmemory est une « couche mémoire » locale pour agents IA de codage qui capture l’activité d’une session d’agent, puis fournit un rappel rapide pour les étapes suivantes. Il s’exécute sur votre machine en tant que processus Node unique et stocke l’état sur disque au format JSON, sans bases de données externes.

Le système capture les appels d’outils et les prompts via des hooks de capture automatique, consolide les observations brutes en mémoires sémantiques, et propose une récupération via un pipeline hybride (BM25 + vecteur + graphe de connaissances) avec reranking sur l’appareil.

Fonctionnalités principales

Exécution locale avec état JSON sur disque (zéro base externe) : Fonctionne comme un processus Node unique et persiste les données sur disque au format JSON ; il ne nécessite pas Redis, Kafka, Postgres, Qdrant ni Neo4j.
Hooks de capture automatique pour l’activité de l’agent : PreToolUse, PostToolUse, SessionStart, Stop et d’autres événements alimentent le pipeline mémoire sans code supplémentaire une fois installé.
Récupération hybride avec reranking sur l’appareil : La récupération en triple flux combine les signaux BM25, vecteur et graphe de connaissances et reranke les résultats sur l’appareil (décrit comme « P50 sous 20 ms sur un portable » sur la page).
Comportement d’auto-consolidation et de rétention : Des balayages horaires consolident les observations brutes en mémoires sémantiques, fusionnent les doublons, décayent les lignes périmées avec un score de rétention, et émettent des lignes d’audit en batch lorsque des éléments sont删除.
MCP server avec une surface d’outils définie : Expose les MCP tools tels que memory_save, memory_recall, memory_smart_search, memory_sessions, governance, audit et export, ainsi que un REST twin pour chaque MCP tool sous /agentmemory/*.
Replay de session via import JSONL : Rehydrate une session à partir d’un transcript JSONL de Claude Code,包括 observations, tool uses et timeline, dans le store.
Compression et querying du graphe de connaissances : Extrait les entités et relations pendant la compression ; supporte le querying du graphe via /agentmemory/graph et la visualisation dans le viewer.
Sync fédéré entre nodes (HTTPS authentifié) : Push/pull memories entre nodes agentmemory avec authentification bearer-token ; la page indique explicitement « no silent syncs. »
Local viewer et sortie d’observabilité : Fournit un live observation stream viewer (port 3113) et logs/traces via un « OTEL observability worker » (OTLP export pour tracing backends tels que Jaeger/Honeycomb/Tempo mentionnés sur la page).

Comment utiliser agentmemory

Installer une fois : Exécutez npm install -g @agentmemory/agentmemory pour mettre agentmemory sur votre PATH.
Lancer le serveur : Lancez agentmemory (server runs on :3111, viewer on :3113).
Vérifier en local : Ouvrez http://localhost:3113 pour voir le live observation stream et les dashboards.
Connecter un agent via MCP : Configurez votre agent pour utiliser la MCP JSON configuration de agentmemory (le site indique « one MCP JSON fits almost everything »).
Importer des sessions passées (optionnel) : Utilisez la JSONL session import capability pour replay des agent runs antérieurs dans le store.

Cas d’usage

Construire une continuité entre plusieurs sessions de codage : Capture chaque session’s prompts et tool usage pour que later agent actions puissent retrieve relevant past observations rapidement.
Support de l’audit « pourquoi l’agent a-t-il fait cela ? » : Utilisez l’audit emission pour les deletes et l’observability/tracing output pour inspecter ce happened durant les memory operations et session handling.
Améliorer la qualité de la retrieval pour des queries mixtes : Utilisez la hybrid search (BM25 + vector + knowledge graph) avec on-device reranking quand les queries sont partly lexical, partly semantic, ou dépendent de extracted relations.
Transformer des transcripts en mémoire réutilisable : Import Claude Code JSONL transcripts pour rehydrate un full session timeline—useful quand vous avez past runs que vous want to query later.
Coordonner entre plusieurs machines d’agent : Set up peer-to-peer sync entre agentmemory nodes avec authenticated HTTPS pour push/pull memory exchange.

FAQ

agentmemory nécessite-t-il une base de données externe (comme Postgres ou Qdrant) ? Non. La page indique « ZÉRO BASES DE DONNÉES EXTERNES » et décrit le système comme un processus unique dont l’état est stocké sur disque au format JSON.
Comment accéder aux outils d’enregistrement et de rappel de mémoire ? agentmemory expose un serveur MCP avec des outils tels que memory_save et memory_recall. La page mentionne également des points de terminaison REST pour chaque outil sous /agentmemory/*.
Où puis-je voir ce que le serveur capture ? Un visualiseur démarre automatiquement sur le port 3113, affichant le flux d’observations en direct, l’explorateur de sessions, le navigateur de mémoire, la visualisation du graphe de connaissances et un tableau de bord de santé.
Puis-je importer des transcriptions de codage existantes ? Oui. La page décrit un workflow d’import JSONL qui ingère une transcription Claude Code JSONL et réhydrate les observations, les utilisations d’outils et la chronologie.
agentmemory prend-il en charge le déplacement des données de mémoire entre machines ? La page décrit une synchronisation pair-à-pair via HTTPS authentifié avec jetons porteurs (et sans synchronisations silencieuses).

Alternatives

Bases de données vectorielles générales + couche mémoire agent personnalisée : Vous pouvez stocker des embeddings et implémenter la récupération,但 vous devez gérer l’orchestration, la consolidation, les hooks et la gestion des sessions/chronologies — contrairement à l’auto-capture + surface MCP/REST décrite pour agentmemory.
Outils de base de connaissances locale pour l’historique du code (systèmes de type note/graphe) : Les outils qui indexent des documents et offrent des vues de recherche/graphe peuvent aider pour le rappel, mais ils ne capturent pas directement les appels d’outils agent et les événements de session via le pipeline de hooks décrit ici.
Cadres RAG sans auto-capture agent-spécifique : De nombreux stacks RAG offrent la récupération et l’assemblage de contexte à la génération, mais nécessitent souvent une intégration plus personnalisée pour capturer les événements SessionStart/Stop et les utilisations d’outils dans un modèle de mémoire récupérable.
Configurations de télémétrie/observabilité agent uniquement : Les outils de traçage peuvent aider à inspecter le comportement, mais ils ne fournissent généralement pas la consolidation de mémoire, les points de terminaison de récupération et le workflow d’import de relecture décrit pour agentmemory.

agentmemory

Qu’est-ce qu’agentmemory ?

Fonctionnalités principales

Comment utiliser agentmemory

Cas d’usage

FAQ

Alternatives

Alternatives

Falconer

skills-janitor

Lasso

Codex Plugins

Struere

garden-md