agentmemory
agentmemory crea memoria local para agentes de IA: captura sesiones y ofrece recuperación híbrida rápida. Se ejecuta en un solo proceso Node con estado JSON en disco.
¿Qué es agentmemory?
agentmemory es una “capa de memoria” local para agentes de IA de codificación que captura la actividad de una sesión del agente y proporciona recuperación rápida para pasos posteriores. Se ejecuta en tu máquina como un único proceso Node y almacena el estado en disco como JSON, sin bases de datos externas.
El sistema captura llamadas a herramientas y prompts mediante hooks de captura automática, consolida observaciones en bruto en memorias semánticas y ofrece recuperación mediante un pipeline híbrido (BM25 + vector + grafo de conocimiento) y reranking en dispositivo.
Características principales
- Ejecución local con estado JSON en disco (sin bases de datos externas): Funciona como un solo proceso Node y persiste datos en disco como JSON; no requiere Redis, Kafka, Postgres, Qdrant ni Neo4j.
- Hooks de captura automática para la actividad del agente: PreToolUse, PostToolUse、SessionStart, Stop y otros eventos alimentan el pipeline de memoria sin código adicional una vez instalado.
- Recuperación híbrida con reranking en dispositivo: La recuperación de triple flujo combina señales de BM25, vector y grafo de conocimiento y reordena resultados en dispositivo (descrito como “P50 bajo 20ms en un portátil” en la página).
- Comportamiento de consolidación y retención automática: Barridos horarios consolidan observaciones en bruto en memorias semánticas、fusionan duplicados, eliminan filas obsoletas mediante puntuación de retención y emiten filas de auditoría por lotes cuando se eliminan elementos.
- Servidor MCP con superficie de herramientas definida: Expone herramientas MCP como
memory_save,memory_recall,memory_smart_search,memory_sessions,governance,audityexport, junto con un gemelo REST para cada herramienta MCP bajo/agentmemory/*. - Reproducción de sesión mediante importación JSONL: Rehidrata una sesión de una transcripción JSONL de Claude Code, incluidas observaciones, usos de herramientas y línea temporal, en el almacén.
- Compresión y consulta del grafo de conocimiento: Extrae entidades y relaciones durante la compresión; admite consulta de grafos vía
/agentmemory/graphy visualización en el visor. - Sincronización federada entre nodos (HTTPS autenticado): Empuja y extrae memorias entre nodos de agentmemory con autenticación de token portador; la página indica explícitamente “sin sincronizaciones silenciosas”.
- Visor local y salida de observabilidad: Proporciona un visor de flujo de observaciones en vivo (puerto 3113) y logs/trazas mediante un “trabajador de observabilidad OTEL” (exportación OTLP para backends de trazas como Jaeger/Honeycomb/Tempo mencionados en la página).
Cómo usar agentmemory
- Instalar una vez: Ejecuta
npm install -g @agentmemory/agentmemorypara poneragentmemoryen tu PATH. - Iniciar el servidor: Lanza
agentmemory(servidor en:3111, visor en:3113). - Verificar localmente: Abre
http://localhost:3113para ver el flujo de observaciones en vivo y los dashboards. - Conectar un agente vía MCP: Configura tu agente para usar la configuración JSON MCP de agentmemory (el sitio indica “un JSON MCP encaja con casi todo”).
- Importar sesiones pasadas opcionalmente: Usa la capacidad de importación de sesiones JSONL para reproducir ejecuciones de agentes anteriores en el almacén.
Casos de uso
- Construir continuidad a través de múltiples sesiones de codificación: Captura prompts y uso de herramientas de cada sesión para que las acciones posteriores del agente puedan recuperar rápidamente observaciones relevantes del pasado.
- Soporte para auditoría “¿por qué el agente hizo eso?”: Usa la emisión de auditoría descrita para eliminaciones y la salida de observabilidad/traza para inspeccionar lo que ocurrió durante las operaciones de memoria y el manejo de sesiones.
- Mejorar la calidad de recuperación para consultas mixtas: Usa la búsqueda híbrida (BM25 + vector + grafo de conocimiento) con reranking en dispositivo,当查询是部分 léxica, parte semántica o depende de relaciones extraídas.
- Convertir transcripciones en memoria reutilizable: Importa transcripciones JSONL de Claude Code para rehidratar una línea temporal completa de sesión—útil cuando tienes ejecuciones anteriores que quieres consultar más tarde.
- Coordinar entre múltiples máquinas de agentes: Configura sincronización entre pares entre nodos de agentmemory usando HTTPS autenticado para intercambio de memoria push/pull.
FAQ
-
¿agentmemory requiere una base de datos externa (como Postgres o Qdrant)? No. La página indica “ZERO EXTERNAL DATABASES” y describe el sistema como un único proceso con estado almacenado en disco como JSON.
-
¿Cómo accedo a las herramientas para guardar y recuperar memoria? agentmemory expone un servidor MCP con herramientas como
memory_saveymemory_recall. La página también menciona endpoints REST para cada herramienta bajo/agentmemory/*. -
¿Dónde puedo ver lo que está capturando el servidor? Un visor se inicia automáticamente en el puerto 3113, mostrando el flujo de observación en vivo, el explorador de sesiones, el navegador de memoria, la visualización del grafo de conocimiento y un panel de salud.
-
¿Puedo importar transcripciones de codificación existentes? Sí. La página describe un flujo de importación de sesiones JSONL que ingiere una transcripción JSONL de Claude Code y rehidrata observaciones, usos de herramientas y línea de tiempo.
-
¿agentmemory admite mover datos de memoria entre máquinas? La página describe la sincronización entre pares mediante HTTPS autenticado con requisitos de token portador (y sin sincronizaciones silenciosas).
Alternativas
- Bases de datos vectoriales de propósito general + capa de memoria de agente personalizada: Puedes almacenar embeddings e implementar recuperación, pero serías responsable de la orquestación, consolidación, hooks y manejo de sesiones/línea de tiempo, a diferencia de la captura automática + superficie MCP/REST descrita para agentmemory.
- Herramientas locales de base de conocimientos para historial de código (sistemas estilo nota/grafo): Las herramientas que indexan documentos y proporcionan vistas de búsqueda/grafo pueden ayudar con la recuperación, pero es posible que no capturen directamente las llamadas de herramientas de agente y los eventos de sesión a través del pipeline de hooks descrito aquí.
- Frameworks RAG sin captura automática específica de agentes: Muchos stacks RAG proporcionan recuperación y ensamblaje de contexto en tiempo de generación, pero pueden requerir una integración más personalizada para capturar eventos SessionStart/Stop y de uso de herramientas en un modelo de memoria recuperable.
- Configuraciones de telemetría/observabilidad de agentes únicamente: Las herramientas de rastreo pueden ayudar a inspeccionar el comportamiento, pero normalmente no proporcionan la consolidación de memoria, los endpoints de recuperación y el flujo de importación de re-play descrito para agentmemory.
Alternativas
Falconer
Falconer es una plataforma de conocimiento autoactualizable para equipos ágiles: escribe, comparte y encuentra documentación interna y contexto de código en un solo lugar.
skills-janitor
skills-janitor audita y registra el uso de tus habilidades de Claude Code, comparándolas con 9 acciones de slash y sin dependencias.
Lasso
Lasso es un PIM con IA para equipos de ecommerce: enriquece atributos y descripciones, procesa datos de proveedores y monitoriza competidores por app o API.
Codex Plugins
Usa Codex Plugins para combinar skills, integraciones de apps y servidores MCP en flujos reutilizables que amplían el acceso de Codex a Gmail, Drive y Slack.
Struere
Struere es un sistema operativo nativo de IA que reemplaza los flujos en hojas de cálculo por software estructurado: paneles, alertas y automatizaciones.
garden-md
Convierte transcripciones de reuniones en un wiki de empresa estructurado y enlazado con archivos Markdown locales y vista HTML; sincroniza desde fuentes compatibles.