UStackUStack
Kagura icon

Kagura

Kagura: arnés open source de pruebas de automatización del navegador para agentes de IA. Soporta MCP, HTTP API, Playwright, flujos de email y CI/CD.

Kagura

¿Qué es Kagura?

Kagura es un arnés de pruebas open source para agentes de IA que necesitan validar su trabajo en un navegador real. Permite a un agente abrir una sesión de navegador, ejecutar flujos de usuario (clics, formularios, navegación) y verificar resultados antes del despliegue.

El propósito principal es cerrar la brecha entre “el agente escribió el código” y “el código funciona realmente en la UI”. Kagura proporciona control del navegador, manejo de flujos de email (como magic links y OTPs), y la capacidad de publicar acciones capturadas o resultados de pruebas en CI/CD.

Características clave

  • Control de navegador con un comando para agentes: Inicia la automatización del navegador desde un comando CLI, diseñado para agentes de IA que llaman herramientas durante codificación y verificación.
  • Soporte para MCP y HTTP API: Usa Kagura vía MCP (integración nativa con Claude Code) o vía HTTP API para que funcione con diferentes runtimes de agentes.
  • Operaciones de navegador con Playwright: Navega páginas, recorre flujos, rellena formularios y captura screenshots usando control basado en Playwright.
  • Habilidades de email para flujos de verificación: Maneja magic links, OTPs y verificación de email para que las pruebas del navegador no se atasquen en pasos de “revisa tu bandeja”.
  • Análisis de DOM y árbol de accesibilidad: Proporciona una vista estructurada de accesibilidad para que el agente entienda la estructura de la página más allá del renderizado visual.
  • Registro de acciones con replay en CI/CD: Graba acciones y las reproduce en CI/CD sin requerir que el agente reescriba scripts de pruebas.

Cómo usar Kagura

  1. Instala el CLI: El sitio muestra npm install -g @kagura-run/cli.
  2. Inicia el arnés: Ejecuta un comando para lanzar el control del navegador para tu agente de IA.
  3. Conecta el agente: Configura el agente para usar Kagura mediante configuración MCP (integración con Claude Code) o la HTTP API.
  4. Ejecuta flujos y recopila evidencia: Deja que el agente navegue, interactúe con la UI y capture screenshots; usa las acciones grabadas como base para ejecuciones de pruebas.
  5. Publica en CI/CD: Las pruebas están diseñadas para publicarse automáticamente y ejecutarse en cada push, como se describe en el sitio.

Casos de uso

  • Verificación de UI tras generación de código: Un agente hace cambios y usa Kagura para recorrer paths críticos de UI, confirmando comportamiento esperado con interacciones grabadas y screenshots.
  • Pruebas de autenticación y onboarding con email: Para flujos con magic links, OTPs o verificación de email, las habilidades de email de Kagura ayudan al agente a completar el journey del navegador.
  • Regresión automatizada en CI/CD sin escribir nuevos scripts: Captura acciones una vez y reprodúcelas en CI/CD, permitiendo ejecuciones repetibles en cada push como describe el sitio.
  • QA impulsada por agente con comprensión de accesibilidad: Usa el árbol de accesibilidad estructurado para que el agente razone sobre elementos y acciones de página de forma más estructurada.
  • Integración de herramientas en múltiples agentes de codificación: Usa MCP con Claude Code, o la HTTP API para que Codex, Cursor u otros agentes compatibles con curl dirijan pruebas del navegador.

Preguntas frecuentes

  • ¿Funciona Kagura con Claude Code? Sí. El sitio indica que Kagura tiene integración “MCP nativa” con Claude Code, donde lo agregas a tu config MCP.

  • ¿Puedo usar Kagura con agentes además de Claude Code? Sí. El sitio lista uso de MCP para Claude Code y menciona una HTTP API usable por otros agentes como Codex y Cursor.

  • ¿Cómo maneja Kagura flujos de login o verificación? Kagura incluye habilidades de email para magic links, OTPs y verificación de email, lo que ayuda a la automatización del navegador a completar pasos que normalmente requieren acceso al email del usuario.

  • ¿Qué artefactos de prueba produce Kagura? El sitio describe grabación de acciones y captura de screenshots, y publicación de pruebas en CI/CD (incluyendo replay de acciones grabadas).

  • ¿Es Kagura autoalojado o en la nube? La página describe ambas opciones: ejecución autoalojada en tu infraestructura propia y opción de alojamiento gestionado en la nube con CI/CD y email incluidos.

Alternativas

  • Frameworks generales de automatización del navegador (p. ej., Playwright/Selenium) con código de pruebas personalizado: Pueden automatizar pruebas de UI, pero suelen requerir que escribas y mantengas scripts de pruebas en lugar de usar un arnés diseñado específicamente para agentes de IA.
  • Frameworks de agentes con herramientas integradas de UI/DOM: Algunas plataformas de agentes incluyen automatización del navegador o herramientas, pero pueden no ofrecer la misma combinación de habilidades para flujos de email y publicación/reproducción en CI/CD.
  • Herramientas de pruebas de extremo a extremo centradas en la creación de pruebas: Las suites E2E pueden validar el comportamiento de la app, pero generalmente se centran en casos de prueba escritos por humanos en lugar de grabación/reproducción diseñada para ejecución impulsada por agentes.
  • Servicios de automatización compatibles con MCP: Si ya dependes mucho de MCP para la orquestación de agentes, podrías buscar otras herramientas MCP que expongan control del navegador, con el inconveniente de que tendrías que implementar tú mismo el manejo de email y la publicación en CI/CD.