Kagura
Kagura è un harness di test open source per agenti di coding AI: controlla il browser con Playwright, supporta MCP e HTTP API, e verifica flussi email.
Cos'è Kagura?
Kagura è un harness di test open source per agenti di coding AI che devono validare il loro lavoro in un browser reale. Permette a un agente di aprire una sessione browser, guidare flussi utente (clic, compilazione form, navigazione) e verificare i risultati prima del rilascio.
Lo scopo principale è colmare il divario tra “l'agente ha scritto il codice” e “il codice funziona davvero nell'UI”. Kagura fornisce controllo del browser, gestione di flussi email (come magic link e OTP) e la possibilità di pubblicare azioni catturate o risultati di test su CI/CD.
Caratteristiche Principali
- Controllo browser con un comando per agenti: Avvia l'automazione browser da un comando CLI, progettato per agenti AI che possono chiamare tool durante coding e verifica.
- Supporto MCP e HTTP API: Usa Kagura tramite MCP (integrazione nativa first-class con Claude Code) o tramite HTTP API per funzionare con diversi runtime di agenti.
- Operazioni browser basate su Playwright: Naviga pagine, clicca attraverso flussi, compila form e cattura screenshot usando il controllo basato su Playwright.
- Competenze email per flussi di verifica: Gestisce magic link, OTP e verifica email così i test browser non si bloccano sui passaggi “controlla la tua inbox”.
- Analisi DOM e albero di accessibilità: Fornisce una vista strutturata di accessibilità così l'agente capisce la struttura della pagina oltre al rendering visivo.
- Logging azioni con replay in CI/CD: Registra azioni e le riproduce in CI/CD senza richiedere all'agente di riscrivere script di test.
Come Usare Kagura
- Installa il CLI: Il sito mostra
npm install -g @kagura-run/cli. - Avvia il harness: Esegui un comando per lanciare il controllo browser per il tuo agente di coding AI.
- Connetti l'agente: Configura l'agente per usare Kagura tramite configurazione MCP (integrazione Claude Code) o HTTP API.
- Esegui flussi e raccogli evidenze: Lascia che l'agente navighi, interagisca con l'UI e catturi screenshot; usa le azioni registrate come base per i run di test.
- Pubblica su CI/CD: I test sono progettati per essere pubblicati automaticamente così possono girare ad ogni push, come descritto sul sito.
Casi d'Uso
- Verifica UI dopo generazione codice: Un agente apporta modifiche e poi usa Kagura per cliccare attraverso percorsi UI critici e confermare il comportamento atteso con interazioni registrate e screenshot.
- Test autenticazione e onboarding basati su email: Per flussi con magic link, OTP o verifica email, le competenze email di Kagura aiutano l'agente a completare il percorso browser.
- Regressione automatizzata in CI/CD senza scrivere nuovi script: Cattura azioni una volta e riproducile in CI/CD, abilitando run ripetibili ad ogni push come descritto sul sito.
- QA agent-driven con comprensione UI accessibile: Usa l'albero di accessibilità strutturato così l'agente può ragionare su elementi e azioni pagina in modo più strutturato.
- Integrazione tool tra più agenti di coding: Usa MCP con Claude Code, o HTTP API così Codex, Cursor o altri agenti curl-capable possono guidare test browser.
FAQ
-
Kagura funziona con Claude Code? Sì. Il sito afferma che Kagura ha integrazione “MCP nativa” con Claude Code, dove lo aggiungi alla tua config MCP.
-
Posso usare Kagura con agenti oltre a Claude Code? Sì. Il sito elenca l'uso MCP per Claude Code e menziona anche un HTTP API usabile da altri agenti come Codex e Cursor.
-
Come gestisce Kagura i flussi di login o verifica? Kagura include competenze email per magic link, OTP e verifica email, che aiutano l'automazione browser a completare passaggi che normalmente richiedono accesso email utente.
-
Quali artefatti di test produce Kagura? Il sito descrive registrazione azioni e cattura screenshot, e pubblicazione test su CI/CD (incluso replay di azioni registrate).
-
Kagura è self-hosted o cloud hosted? La pagina descrive entrambe le opzioni: run self-hosted sulla tua infrastruttura e opzione hosting cloud managed con CI/CD ed email inclusi.
Alternative
- Framework generali di automazione browser (es. Playwright/Selenium) con codice di test personalizzato: Possono automatizzare i test UI, ma richiedono tipicamente di scrivere e mantenere script di test anziché usare un harness specifico per agenti AI.
- Framework di agenti con tooling UI/DOM integrato: Alcune piattaforme di agenti includono automazione browser o tooling, ma potrebbero non offrire la stessa combinazione di competenze per flussi email e workflow di pubblicazione/riplay in CI/CD.
- Tool di test end-to-end focalizzati sulla creazione di test: Le suite E2E possono validare il comportamento dell'app, ma ruotano generalmente su casi di test scritti da umani invece che su registrazione/riplay pensata per esecuzione agent-driven.
- Servizi di automazione compatibili con MCP: Se dipendi già pesantemente da MCP per l'orchestrazione degli agenti, potresti cercare altri tool MCP che espongono il controllo browser, con il compromesso di dover assemblare tu stesso la gestione email e la pubblicazione in CI/CD.
Alternative
Ably Chat
Ably Chat è un’API e SDK per chat realtime: crea applicazioni personalizzate con reazioni, presenza e modifica/eliminazione dei messaggi.
AakarDev AI
AakarDev AI è una piattaforma potente che semplifica lo sviluppo di applicazioni AI con integrazione fluida dei database vettoriali, consentendo un rapido deployment e scalabilità.
DeepMotion
DeepMotion è una piattaforma AI di motion capture e body-tracking per creare animazioni 3D da video (e testo) nel browser, con Animate 3D API.
Arduino VENTUNO Q
Arduino VENTUNO Q è un edge AI computer per robotica: unisce inferenza AI e microcontrollore per controllo deterministico, con sviluppo in Arduino App Lab.
Devin
Devin è un agente AI per la programmazione che aiuta i team software a completare migrazioni e grandi refactoring eseguendo sottotask in parallelo, con approvazione umana.
imgcook
imgcook è uno strumento intelligente che converte i mockup di progettazione in codice di alta qualità, pronto per la produzione, con un solo clic.