Kagura
Kagura é um framework open source de testes de automação no navegador para agentes de IA: suporta MCP, HTTP API e controle com Playwright.
O que é Kagura?
Kagura é um framework open source de testes para agentes de IA que precisam validar seu trabalho em um navegador real. Ele permite que um agente abra uma sessão de navegador, execute fluxos de usuário (clique, preencha formulários, navegue) e verifique resultados antes de entregar.
O propósito principal é fechar a lacuna entre “o agente escreveu o código” e “o código realmente funciona na UI”. Kagura fornece controle de navegador, manipulação de fluxos de e-mail (como magic links e OTPs) e a capacidade de publicar ações capturadas ou resultados de testes no CI/CD.
Principais Recursos
- Controle de navegador com um comando para agentes: Inicie automação de navegador via comando CLI, projetado para agentes de IA que chamam ferramentas durante codificação e verificação.
- Suporte a MCP e HTTP API: Use Kagura via MCP (integração nativa com Claude Code) ou via HTTP API para funcionar com diferentes runtimes de agentes.
- Operações de navegador com Playwright: Navegue por páginas, clique em fluxos, preencha formulários e capture screenshots usando controle baseado em Playwright.
- Habilidades de e-mail para fluxos de verificação: Lide com magic links, OTPs e verificação de e-mail para que testes no navegador não travem em etapas “verifique sua caixa de entrada”.
- Análise de DOM e árvore de acessibilidade: Fornece uma visão estruturada de acessibilidade para que o agente entenda a estrutura da página além da renderização visual.
- Log de ações com replay no CI/CD: Grave ações e reproduza-as no CI/CD sem exigir que o agente reescreva scripts de teste.
Como Usar Kagura
- Instale o CLI: O site mostra
npm install -g @kagura-run/cli. - Inicie o framework: Execute um comando para lançar o controle de navegador para seu agente de IA.
- Conecte o agente: Configure o agente para usar Kagura via configuração MCP (integração Claude Code) ou HTTP API.
- Execute fluxos e colete evidências: Deixe o agente navegar, interagir com a UI e capturar screenshots; use as ações gravadas como base para execuções de teste.
- Publique no CI/CD: Os testes são projetados para publicação automática, rodando a cada push, como descrito no site.
Casos de Uso
- Verificação de UI após geração de código: Um agente faz alterações e usa Kagura para clicar em caminhos críticos de UI, confirmando comportamento esperado com interações e screenshots gravados.
- Testes de autenticação e onboarding com e-mail: Para fluxos com magic links, OTPs ou verificação de e-mail, as habilidades de e-mail do Kagura ajudam o agente a completar a jornada no navegador.
- Regressão automatizada no CI/CD sem novos scripts: Grave ações uma vez e reproduza no CI/CD, permitindo execuções repetíveis a cada push, como descrito no site.
- QA impulsionado por agente com entendimento de acessibilidade: Use a árvore de acessibilidade estruturada para que o agente raciocine sobre elementos e ações de página de forma mais estruturada.
- Integração de ferramentas em múltiplos agentes de codificação: Use MCP com Claude Code ou HTTP API para que Codex, Cursor ou outros agentes compatíveis com curl controlem testes no navegador.
FAQ
-
Kagura funciona com Claude Code? Sim. O site afirma que Kagura tem integração “MCP nativa” com Claude Code, adicionando-o à sua configuração MCP.
-
Posso usar Kagura com agentes além do Claude Code? Sim. O site lista uso de MCP para Claude Code e menciona uma HTTP API que pode ser usada por outros agentes como Codex e Cursor.
-
Como o Kagura lida com fluxos de login ou verificação? Kagura inclui habilidades de e-mail para magic links, OTPs e verificação de e-mail, ajudando a automação de navegador a completar etapas que normalmente exigem acesso ao e-mail do usuário.
-
Quais artefatos de teste o Kagura produz? O site descreve gravação de ações e captura de screenshots, e publicação de testes no CI/CD (incluindo replay de ações gravadas).
-
Kagura é self-hosted ou cloud hosted? A página descreve ambas as opções: execução self-hosted na sua infraestrutura e opção de hospedagem cloud managed com CI/CD e e-mail incluídos.
Alternativas
- Frameworks gerais de automação de navegador (ex.: Playwright/Selenium) com código de teste personalizado: Eles podem automatizar testes de UI, mas geralmente exigem que você crie e mantenha scripts de teste, em vez de usar um harness projetado especificamente para agentes de IA.
- Frameworks de agentes com ferramentas de UI/DOM integradas: Algumas plataformas de agentes incluem automação de navegador ou ferramentas, mas podem não oferecer a mesma combinação de habilidades para fluxos de e-mail e workflow de publicação/reprodução em CI/CD.
- Ferramentas de teste end-to-end focadas em criação de testes: Suítes E2E podem validar o comportamento do app, mas geralmente centram-se em casos de teste criados por humanos, em vez de gravação/reprodução projetada para execução por agentes.
- Serviços de automação compatíveis com MCP: Se você já depende muito de MCP para orquestração de agentes, pode procurar outras ferramentas MCP que exponham controle de navegador, com o tradeoff de que você precisará montar o tratamento de e-mails e publicação em CI/CD por conta própria.
Alternativas
Ably Chat
Ably Chat é uma API de chat e SDKs para criar apps de mensagens em tempo real com reações, presença e edição/remoção de mensagens.
AakarDev AI
AakarDev AI é uma plataforma poderosa que simplifica o desenvolvimento de aplicações de IA com integração perfeita de banco de dados vetorial, permitindo implantação rápida e escalabilidade.
DeepMotion
DeepMotion é uma plataforma de body-tracking e motion capture com IA para gerar animações 3D a partir de vídeo (ou texto) no navegador, com Animate 3D API.
Arduino VENTUNO Q
Arduino VENTUNO Q é um computador edge AI para robótica, unindo inferência e microcontrolador para controle determinístico. Desenvolva no Arduino App Lab.
Devin
Devin é um agente de IA para codificação que ajuda equipes de software em migrações e grandes refatorações, executando subtarefas em paralelo.
imgcook
imgcook é uma ferramenta inteligente que converte maquetes de design em código de alta qualidade, pronto para produção, com um único clique.