UStackUStack
Kagura icon

Kagura

Kagura 是開源瀏覽器自動化測試工具,供 AI 程式代理驗證實際 UI;支援 MCP(Claude Code)、HTTP API、Playwright 與 CI/CD 重播。

Kagura

Kagura 是什麼?

Kagura 是開源測試工具,供 AI 程式代理在真實瀏覽器中驗證其工作成果。它讓代理開啟瀏覽器工作階段、驅動使用者流程(點擊、填表、導航),並在發佈前驗證結果。

核心目的是縮短「代理寫了程式碼」與「程式碼在 UI 中實際運作」之間的差距。Kagura 提供瀏覽器控制、電子郵件流程處理(例如魔法連結與 OTP),以及將擷取動作或測試結果發佈至 CI/CD 的功能。

主要功能

  • 代理一鍵瀏覽器控制:從 CLI 指令啟動瀏覽器自動化,專為可在編碼與驗證時呼叫工具的 AI 代理設計。
  • MCP 與 HTTP API 支援:透過 MCP(原生 Claude Code 整合)或 HTTP API 使用 Kagura,適用不同代理執行環境。
  • Playwright 驅動的瀏覽器操作:使用 Playwright 控制導航頁面、點擊流程、填表,並擷取螢幕截圖。
  • 驗證流程的電子郵件功能:處理魔法連結、OTP 與電子郵件驗證,避免瀏覽器測試卡在「檢查收件匣」步驟。
  • DOM 分析與輔助功能樹:提供結構化輔助功能檢視,讓代理理解頁面結構,而非僅視覺渲染。
  • 動作記錄與 CI/CD 重播:記錄動作並在 CI/CD 中重播,無需代理重寫測試腳本。

如何使用 Kagura

  1. 安裝 CLI:網站顯示 npm install -g @kagura-run/cli
  2. 啟動測試工具:執行單一指令,為 AI 程式代理啟動瀏覽器控制。
  3. 連接代理:設定代理透過 MCP 配置(Claude Code 整合)或 HTTP API 使用 Kagura。
  4. 執行流程並收集證據:讓代理導航、互動 UI 並擷取螢幕截圖;以記錄動作作為測試執行基礎。
  5. 發佈至 CI/CD:測試設計為自動發佈,每筆推送皆可執行,如網站所述。

使用情境

  • 程式碼產生後的 UI 驗證:代理變更後,使用 Kagura 點擊關鍵 UI 路徑,透過記錄互動與螢幕截圖確認預期行為。
  • 依賴電子郵件的認證與入門測試:針對魔法連結、OTP 或電子郵件驗證流程,Kagura 的電子郵件功能助代理完成瀏覽器流程。
  • 無需新腳本的 CI/CD 自動回歸測試:擷取動作一次,即可在 CI/CD 中重播,每筆推送皆可重複執行,如網站所述。
  • 代理主導的輔助功能感知 QA:使用結構化輔助功能樹,讓代理以更結構化方式推理頁面元素與動作。
  • 跨多程式代理的工具整合:使用 Claude Code 時選 MCP,或使用 HTTP API 讓 Codex、Cursor 或其他支援 curl 的代理驅動瀏覽器測試。

常見問題

  • Kagura 支援 Claude Code 嗎? 是的。網站指出 Kagura 具「MCP 原生」整合 Claude Code,只需加入 MCP 配置。

  • Kagura 能用於 Claude Code 以外的代理嗎? 是的。網站列出 Claude Code 的 MCP 使用,並提及 HTTP API 可用於 Codex、Cursor 等其他代理。

  • Kagura 如何處理登入或驗證流程? Kagura 包含魔法連結、OTP 與電子郵件驗證的電子郵件功能,助瀏覽器自動化完成通常需使用者存取郵件的步驟。

  • Kagura 產生哪些測試產物? 網站描述記錄動作、擷取螢幕截圖,並將測試發佈至 CI/CD(包含重播記錄動作)。

  • Kagura 是自託管還是雲端託管? 頁面描述兩種選項:自託管於自家基礎設施,或 雲端託管 選項包含 CI/CD 與電子郵件。

替代方案

  • 通用瀏覽器自動化框架(例如 Playwright/Selenium)搭配自訂測試程式碼:這些能自動化 UI 測試,但通常需要您自行撰寫與維護測試腳本,而非使用專為 AI 代理打造的測試平台。
  • 具內建 UI/DOM 工具的代理框架:某些代理平台包含瀏覽器自動化或工具,但可能無法提供相同的電子郵件流程技能與 CI/CD 發佈/重播工作流程組合。
  • 專注測試撰寫的端到端測試工具:E2E 套件能驗證應用程式行為,但通常以人工撰寫的測試案例為中心,而非為代理驅動執行設計的錄製/重播。
  • 支援 MCP 的自動化服務:若您已高度依賴 MCP 進行代理協調,可尋找其他暴露瀏覽器控制的 MCP 工具,但需自行組裝電子郵件處理與 CI/CD 發佈。