Kaguraとは?
Kaguraは、AIコーディングエージェントが実際のブラウザで作業を検証するためのオープンソーステストハーネスです。エージェントがブラウザセッションを開き、ユーザー操作(クリック、フォーム入力、ナビゲーション)を駆動し、出荷前に結果を検証できます。
主な目的は、「エージェントがコードを書いた」と「UIでコードが実際に動作する」のギャップを埋めることです。Kaguraはブラウザ制御、メールフロー処理(マジックリンクやOTPなど)、CI/CDへのアクションやテスト結果の公開機能を備えています。
主な機能
- エージェント向けワンコマンドブラウザ制御: CLIコマンドからブラウザ自動化を開始。コーディングと検証中にツールを呼び出せるAIエージェント向け設計。
- MCPおよびHTTP API対応: MCP(Claude Codeネイティブ統合)またはHTTP API経由で使用可能。さまざまなエージェントランタイムに対応。
- Playwright駆動のブラウザ操作: Playwrightベースでページ遷移、フロークリック、フォーム入力、スクリリーンショット取得。
- 検証フロー向けメール機能: マジックリンク、OTP、メール検証を処理。「受信ボックスを確認」ステップでテストが止まらない。
- DOM解析とアクセシビリティツリー: 視覚レンダリングを超えたページ構造を構造化アクセシビリティビューで提供。
- CI/CD再生可能なアクションログ: アクションを記録し、CI/CDで再生。エージェントがテストスクリプトを書き直す必要なし。
Kaguraの使い方
- CLIインストール: サイトに記載の
npm install -g @kagura-run/cliを実行。 - ハーネス起動: 1コマンドでAIコーディングエージェント向けブラウザ制御を開始。
- エージェント接続: MCP設定(Claude Code統合)またはHTTP APIでエージェントを設定。
- フロー実行と証拠収集: エージェントがUIを操作・ナビゲートしスクリーンショット取得。記録アクションをテスト実行の基盤に。
- CI/CD公開: サイト記載通り、テストを自動公開しプッシュごとに実行。
ユースケース
- コード生成後のUI検証: エージェントが変更を加え、Kaguraで重要UIパスをクリックし、記録インタラクションとスクリーンショットで期待動作を確認。
- メール依存の認証・オンボーディングテスト: マジックリンク、OTP、メール検証フローで、Kaguraのメール機能がエージェントのブラウザ旅を完遂。
- スクリプト不要のCI/CD回帰テスト: アクションを1度記録しCI/CDで再生。サイト記載通りプッシュごとに繰り返し実行。
- アクセシビリティ対応UI理解のエージェント駆動QA: 構造化アクセシビリティツリーでエージェントがページ要素とアクションを構造的に推論。
- 複数コーディングエージェントのツール統合: Claude CodeではMCPを、Codex、Cursor、その他curl対応エージェントではHTTP APIでブラウザテスト駆動。
FAQ
-
KaguraはClaude Codeと連携しますか? はい。サイトによると、KaguraはClaude Codeに「MCPネイティブ」統合しており、MCP設定に追加するだけです。
-
Claude Code以外のエージェントでKaguraは使えますか? はい。サイトはClaude Code向けMCP使用を記載しつつ、CodexやCursorなどの他のエージェント向けHTTP APIも言及。
-
Kaguraはログインや検証フローをどう処理しますか? Kaguraはマジックリンク、OTP、メール検証向けメール機能を含み、通常ユーザーemailアクセスが必要なステップをブラウザ自動化で完了。
-
Kaguraはどんなテストアーティファクトを生成しますか? サイトによると、アクション記録、スクリリーンショット取得、CI/CD公開(記録アクション再生含む)。
-
Kaguraはセルフホストですか、それともクラウドホストですか? ページは両方を記載:自己インフラでのセルフホスト実行と、CI/CD・メール込みのクラウド管理ホスティングオプション。
代替案
- 汎用ブラウザ自動化フレームワーク(例: Playwright/Selenium)とカスタムテストコード: UIテストを自動化できますが、通常はAIエージェント向けに特化したハーネスではなく、テストスクリプトの作成・保守が必要です。
- UI/DOMツール内蔵のエージェントフレームワーク: 一部のエージェントプラットフォームにブラウザ自動化やツールが含まれますが、メールフロー機能とCI/CD公開/再生ワークフローの組み合わせが同じとは限りません。
- テスト作成に特化したエンドツーエンドテストツール: E2Eスイートでアプリ動作を検証できますが、通常はエージェント駆動実行向けの記録/再生ではなく、人間作成のテストケースに焦点を当てています。
- MCP対応自動化サービス: MCPをエージェントオーケストレーションに多用している場合、ブラウザ制御を公開する他のMCPツールを探せますが、メール処理とCI/CD公開を自力で組み立てるトレードオフがあります。
代替品
Ably Chat
Ably Chatはカスタムリアルタイムチャット用のAPI/SDK。リアクション、プレゼンス、メッセージ編集/削除に対応し高負荷も設計。
AakarDev AI
AakarDev AIは、シームレスなベクターデータベース統合を通じてAIアプリケーションの開発を簡素化し、迅速な展開とスケーラビリティを実現する強力なプラットフォームです。
DeepMotion
DeepMotionはAIモーションキャプチャ/ボディトラッキングで、動画(テキストも可)からWebブラウザで3Dアニメを生成。Animate 3D API連携も。
Arduino VENTUNO Q
Arduino VENTUNO Qはロボット向けエッジAIコンピュータ。AI推論とマイコン制御を統合し、Arduino App Labで埋め込み/ Linux/エッジAI開発。
Devin
Devinは、AIコーディングエージェントとして移行や大規模リファクタのサブタスクを並列実行。人が管理し変更を承認。
imgcook
imgcookは、デザインモックアップをワンクリックで高品質な本番対応コードに変換するインテリジェントツールです。