UStackUStack
Kagura icon

Kagura

Kagura: Open-Source-Testing-Harness für AI-Coding-Agents mit Browser-Automation. Unterstützt MCP, HTTP API, Playwright, E-Mail-Flows, CI/CD-Replay.

Kagura

Was ist Kagura?

Kagura ist ein Open-Source-Testing-Harness für AI-Coding-Agents, die ihre Arbeit in einem echten Browser validieren müssen. Er ermöglicht es einem Agenten, eine Browser-Sitzung zu öffnen, User-Flows zu steuern (Klicken, Formulare ausfüllen, Navigieren) und Ergebnisse zu prüfen, bevor Code bereitgestellt wird.

Der Kernzweck ist, die Lücke zwischen „der Agent hat den Code geschrieben“ und „der Code funktioniert tatsächlich in der UI“ zu schließen. Kagura bietet Browser-Steuerung, E-Mail-Flow-Behandlung (z. B. Magic Links und OTPs) und die Möglichkeit, aufgezeichnete Aktionen oder Testergebnisse in CI/CD zu publizieren.

Wichtige Features

  • Browser-Steuerung per Ein-Kommando für Agents: Starte Browser-Automatisierung über einen CLI-Befehl, speziell für AI-Agents, die Tools beim Codieren und Verifizieren aufrufen können.
  • MCP- und HTTP-API-Unterstützung: Nutze Kagura über MCP (native Claude-Code-Integration) oder eine HTTP-API für verschiedene Agent-Runtimes.
  • Playwright-basierte Browser-Operationen: Navigiere Seiten, klicke Flows durch, fülle Formulare aus und erzeuge Screenshots mit Playwright-Steuerung.
  • E-Mail-Fähigkeiten für Verifizierungs-Flows: Behandle Magic Links, OTPs und E-Mail-Verifizierung, damit Browser-Tests nicht bei „Schau in deinen Posteingang“ stecken bleiben.
  • DOM-Analyse und Accessibility Tree: Biete eine strukturierte Accessibility-Ansicht, damit der Agent die Seitenstruktur jenseits der visuellen Darstellung versteht.
  • Action-Logging mit Replay in CI/CD: Zeichne Aktionen auf und spiele sie in CI/CD ab, ohne dass der Agent Test-Skripte neu schreiben muss.

So nutzt du Kagura

  1. CLI installieren: Die Seite zeigt npm install -g @kagura-run/cli.
  2. Harness starten: Führe einen Befehl aus, um Browser-Steuerung für deinen AI-Coding-Agent zu launchen.
  3. Agent verbinden: Konfiguriere den Agent für Kagura über MCP-Konfiguration (Claude-Code-Integration) oder die HTTP-API.
  4. Flows ausführen und Belege sammeln: Lass den Agent navigieren, mit der UI interagieren und Screenshots aufnehmen; nutze aufgezeichnete Aktionen als Basis für Test-Runs.
  5. In CI/CD publizieren: Tests sind für automatische Publizierung ausgelegt, damit sie bei jedem Push laufen, wie auf der Seite beschrieben.

Anwendungsfälle

  • UI-Verifizierung nach Code-Generierung: Ein Agent ändert Code und nutzt Kagura, um kritische UI-Pfade durchzuklicken und erwartetes Verhalten mit aufgezeichneten Interaktionen und Screenshots zu bestätigen.
  • Testen von Authentifizierung und Onboarding mit E-Mail: Für Flows mit Magic Links, OTPs oder E-Mail-Verifizierung helfen Kaguras E-Mail-Fähigkeiten, den Browser-Journey abzuschließen.
  • Automatisierte Regression in CI/CD ohne neue Skripte: Zeichne Aktionen einmal auf und spiele sie in CI/CD ab, für wiederholbare Runs bei jedem Push, wie auf der Seite beschrieben.
  • Agent-gesteuertes QA mit Accessibility-Verständnis: Nutze den strukturierten Accessibility Tree, damit der Agent Seiten-Elemente und Aktionen strukturierter analysieren kann.
  • Tool-Integration über mehrere Coding-Agents: Verwende MCP mit Claude Code oder die HTTP-API, damit Codex, Cursor oder andere curl-fähige Agents Browser-Tests steuern können.

FAQ

  • Funktioniert Kagura mit Claude Code?
    Ja. Die Seite beschreibt „MCP native“-Integration mit Claude Code, indem du es in deine MCP-Konfig hinzufügst.

  • Kann ich Kagura mit Agents außerhalb von Claude Code nutzen?
    Ja. Die Seite nennt MCP für Claude Code und eine HTTP-API für andere Agents wie Codex und Cursor.

  • Wie handhabt Kagura Login- oder Verifizierungs-Flows?
    Kagura enthält E-Mail-Fähigkeiten für Magic Links, OTPs und E-Mail-Verifizierung, die Browser-Automatisierung bei Schritten mit E-Mail-Zugriff unterstützen.

  • Welche Test-Artefakte erzeugt Kagura?
    Die Seite beschreibt Aufzeichnung von Aktionen, Screenshots und Publizierung von Tests in CI/CD (inkl. Replay aufgezeichneter Aktionen).

  • Ist Kagura selbst gehostet oder Cloud-gehostet?
    Die Seite beschreibt beide Optionen: selbst gehostet auf deiner Infrastruktur und Cloud-gehostet mit CI/CD und E-Mail inklusive.

Alternativen

  • Allgemeine Browser-Automatisierungs-Frameworks (z. B. Playwright/Selenium) mit eigenem Testcode: Diese können UI-Tests automatisieren, erfordern aber typischerweise das Erstellen und Pflegen von Testskripten statt eines Harnesses, der speziell für AI-Agents entwickelt wurde.
  • Agent-Frameworks mit integrierten UI/DOM-Tools: Einige Agent-Plattformen bieten Browser-Automatisierung oder Tools, liefern aber möglicherweise nicht dieselbe Kombination aus E-Mail-Flows und CI/CD-Publish/Replay-Workflow.
  • End-to-End-Testing-Tools mit Fokus auf Test-Erstellung: E2E-Suites können App-Verhalten validieren, konzentrieren sich aber meist auf von Menschen erstellte Testfälle statt Aufzeichnen/Wiedergabe für agentengesteuerte Ausführung.
  • MCP-fähige Automatisierungsdienste: Wenn Sie stark auf MCP für die Agent-Orchestrierung angewiesen sind, könnten Sie nach anderen MCP-Tools mit Browser-Steuerung suchen – mit dem Nachteil, dass Sie E-Mail-Handling und CI/CD-Publishing selbst zusammenbauen müssen.