agentmemory
agentmemory é uma camada de memória local para agentes de IA: captura sessões e oferece recall híbrido rápido, como processo Node único, sem BD externa.
O que é agentmemory?
agentmemory é uma “camada de memória” local para agentes de IA de codificação que captura a atividade da sessão de um agente e oferece recall rápido para etapas posteriores. Funciona na sua máquina como um único processo Node e armazena o estado em disco como JSON, sem bancos de dados externos.
O sistema captura chamadas de ferramentas e prompts por meio de hooks de captura automática, consolida observações brutas em memórias semânticas e fornece recuperação por meio de um pipeline híbrido (BM25 + vetor + grafo de conhecimento) com reranking no dispositivo.
Principais Recursos
- Runtime local com estado JSON em disco (zero bancos de dados externos): Executa como um único processo Node e persiste dados em disco como JSON; não requer Redis, Kafka, Postgres, Qdrant ou Neo4j.
- Hooks de captura automática para atividade do agente: PreToolUse, PostToolUse, SessionStart, Stop e eventos adicionais alimentam o pipeline de memória sem código adicional após a instalação.
- Recuperação híbrida com reranking no dispositivo: A recuperação em três fluxos combina sinais BM25, vetor e grafo de conhecimento e reranqueia os resultados no dispositivo (descrito como “P50 abaixo de 20ms em um laptop” na página).
- Comportamento de consolidação e retenção automática: Varreduras horárias consolidam observações brutas为 memórias semânticas, mesclam duplicatas, reduzem linhas obsoletas usando pontuação de retenção e emitem linhas de auditoria em lote quando itens são excluídos.
- Servidor MCP com superfície de ferramentas definida: Expõe ferramentas MCP como
memory_save,memory_recall,memory_smart_search,memory_sessions,governance,auditeexport, além de um twin REST para cada ferramenta MCP em/agentmemory/*. - Replay de sessão via importação JSONL: Reidrata uma sessão de um transcript JSONL do Claude Code, incluindo observações, usos de ferramentas e cronograma, em den store.
- Compreensão e consulta do grafo de conhecimento: Extrai entidades e relações durante a compressão; suporta consulta de grafo via
/agentmemory/graphe visualização no viewer. - Sincronização federada entre nós (HTTPS autenticado): Push/pull de memórias entre nós agentmemory com autenticação bearer-token; a página nota explicitamente “no silent syncs.”
- Viewer local e saída de observabilidade: Fornece um stream viewer de observações ao vivo (porta 3113) e logs/traces por meio de um “OTEL observability worker” (exportação OTLP para backends de rastreamento como Jaeger/Honeycomb/Tempo mencionados na página).
Como Usar agentmemory
- Instalar uma vez: Execute
npm install -g @agentmemory/agentmemorypara colocaragentmemoryno PATH. - Iniciar o servidor: Inicie
agentmemory(servidor roda em:3111, viewer em:3113). - Verificar localmente: Abra
http://localhost:3113para ver o stream de observações ao vivo e dashboards. - Conectar um agente via MCP: Configure seu agente para usar a configuração JSON MCP do agentmemory (o site afirma “one MCP JSON fits almost everything”).
- Importar sessões anteriores (opcional): Use a capacidade de importação de sessão JSONL fornecida para replay de execuções de agente anteriores em den store.
Casos de Uso
- Construir continuidade entre múltiplas sessões de codificação: Capture prompts e uso de ferramentas de cada sessão para que ações posteriores do agente possam recuperar observações relevantes do passado rapidamente.
- Suporte a auditoria “por que o agente fez isso?”: Use a emissão de auditoria descrita para exclus
FAQ
-
O agentmemory requer um banco de dados externo (como Postgres ou Qdrant)? Não. A página indica “ZERO EXTERNAL DATABASES” e descreve o sistema como um único processo com o estado armazenado em disco como JSON.
-
Como acesso as ferramentas para salvar e recuperar memória? O agentmemory expõe um servidor MCP com ferramentas como
memory_saveememory_recall. A página também menciona endpoints REST para cada ferramenta em/agentmemory/*. -
Onde posso ver o que o servidor está capturando? Um visualizador é iniciado automaticamente na porta 3113, exibindo o fluxo de observação em tempo real, o explorador de sessões, o navegador de memória, a visualização do grafo de conhecimento e um painel de saúde.
-
Posso importar transcrições de codificação existentes? Sim. A página descreve um fluxo de importação de sessão em JSONL que ingere uma transcrição JSONL do Claude Code e reidrata observações, usos de ferramentas e linha do tempo.
-
O agentmemory permite mover dados de memória entre máquinas? A página descreve a sincronização peer-to-peer via HTTPS autenticado com requisitos de bearer-token (e sem sincronizações automáticas).
Alternativas
- Bancos de dados vetoriais de uso geral + camada de memória para agentes personalizada: Você pode armazenar embeddings e implementar recuperação, mas será responsável pela orquestração, consolidação, hooks e gerenciamento de sessões/linha do tempo — diferentemente da captura automática + interface MCP/REST descrita para o agentmemory.
- Ferramentas locais de base de conhecimento para histórico de código (sistemas de notas/grafos): Ferramentas que indexam documentos e fornecem visualizações de busca/grafo podem ajudar com a recuperação, mas podem não capturar diretamente chamadas de ferramentas dos agentes e eventos de sessão via pipeline de hooks descrito aqui.
- Frameworks RAG sem captura automática específica para agentes: Muitos stacks RAG oferecem recuperação e montagem de contexto em tempo de geração, mas podem exigir integração mais personalizada para capturar eventos SessionStart/Stop e uso de ferramentas em um modelo de memória recuperável.
- Configurações de telemetria/observabilidade apenas para agentes: Ferramentas de rastreamento podem ajudar a inspecionar o comportamento, mas geralmente não fornecem a consolidação de memória, endpoints de recuperação e fluxo de importação para replay descrito para o agentmemory.
Alternativas
Falconer
Falconer é uma plataforma de conhecimento que se atualiza sozinha, reunindo documentação interna e contexto de código para equipes rápidas encontrarem e compartilharem.
skills-janitor
skills-janitor audita, rastreia e compara suas skills do Claude Code com nove ações focadas por comandos slash, sem dependências.
Lasso
Lasso é um PIM com IA para equipes de e-commerce: enriquece atributos e descrições, processa dados de fornecedores e monitora concorrentes via app ou API.
Codex Plugins
Use Codex Plugins para combinar skills, integrações de apps e servidores MCP em fluxos reutilizáveis, ampliando o acesso do Codex a Gmail, Drive e Slack.
Struere
Struere é um sistema operacional nativo de IA que substitui planilhas por software estruturado com dashboards, alertas e automações.
garden-md
Transforme transcrições de reuniões em uma wiki de empresa estruturada e vinculada, com arquivos Markdown locais e visualização em HTML, com sincronização.