Kagura란?
Kagura는 작업을 실제 브라우저에서 검증해야 하는 AI 코딩 에이전트를 위한 오픈소스 테스트 하네스입니다. 에이전트가 브라우저 세션을 열고 사용자 흐름(클릭, 양식 입력, 탐색)을 실행하며 배포 전에 결과를 검증할 수 있게 합니다.
핵심 목적은 “에이전트가 코드를 작성했다”와 “코드가 UI에서 실제로 작동한다” 사이의 격차를 메우는 것입니다. Kagura는 브라우저 제어, 이메일 흐름 처리(매직 링크, OTP 등), CI/CD에 캡처된 액션이나 테스트 결과를 게시하는 기능을 제공합니다.
주요 기능
- 에이전트를 위한 원 명령 브라우저 제어: CLI 명령으로 브라우저 자동화를 시작하며, 코딩 및 검증 중 도구를 호출할 수 있는 AI 에이전트용으로 설계되었습니다.
- MCP 및 HTTP API 지원: MCP(Claude Code 네이티브 통합) 또는 HTTP API를 통해 다양한 에이전트 런타임에서 사용할 수 있습니다.
- Playwright 기반 브라우저 작업: Playwright 제어를 통해 페이지 탐색, 흐름 클릭, 양식 입력, 스크린샷 캡처를 수행합니다.
- 검증 흐름을 위한 이메일 기능: 매직 링크, OTP, 이메일 검증을 처리하여 브라우저 테스트가 “인박스 확인” 단계에서 멈추지 않게 합니다.
- DOM 분석 및 접근성 트리: 시각적 렌더링 너머 페이지 구조를 이해할 수 있도록 구조화된 접근성 뷰를 제공합니다.
- CI/CD 재생을 위한 액션 로깅: 액션을 기록하고 에이전트가 테스트 스크립트를 다시 작성하지 않고 CI/CD에서 재생할 수 있습니다.
Kagura 사용 방법
- CLI 설치: 사이트에
npm install -g @kagura-run/cli가 표시됩니다. - 하네스 시작: 한 명령으로 AI 코딩 에이전트를 위한 브라우저 제어를 시작합니다.
- 에이전트 연결: MCP 구성(Claude Code 통합) 또는 HTTP API를 통해 에이전트를 Kagura에 구성합니다.
- 흐름 실행 및 증거 수집: 에이전트가 탐색, UI 상호작용, 스크린샷 캡처를 수행하도록 하고; 기록된 액션을 테스트 실행의 기반으로 사용합니다.
- CI/CD 게시: 사이트에 설명된 대로 테스트를 자동 게시하여 매 푸시마다 실행할 수 있습니다.
사용 사례
- 코드 생성 후 UI 검증: 에이전트가 변경을 수행한 후 Kagura를 사용해 주요 UI 경로를 클릭하며 예상 동작을 기록된 상호작용과 스크린샷으로 확인합니다.
- 이메일에 의존하는 인증 및 온보딩 테스트: 매직 링크, OTP, 이메일 검증 흐름에서 Kagura의 이메일 처리 기능이 에이전트의 브라우저 여정을 완료합니다.
- 새 스크립트 작성 없이 CI/CD 자동 회귀 테스트: 액션을 한 번 캡처하고 CI/CD에서 재생하여 사이트에 설명된 대로 매 푸시마다 반복 실행합니다.
- 접근성 인식 UI 이해를 위한 에이전트 주도 QA: 구조화된 접근성 트리를 사용해 에이전트가 페이지 요소와 액션을 더 구조적으로 추론할 수 있습니다.
- 다양한 코딩 에이전트 간 도구 통합: Claude Code 작업 시 MCP를 사용하거나 HTTP API로 Codex, Cursor 등 curl 지원 에이전트가 브라우저 테스트를 구동합니다.
자주 묻는 질문
-
Kagura는 Claude Code와 작동하나요? 네. 사이트에 따르면 Kagura는 Claude Code와 “MCP 네이티브” 통합을 가지며, MCP 구성에 추가합니다.
-
Claude Code 외 에이전트와 Kagura를 사용할 수 있나요? 네. 사이트는 Claude Code용 MCP 사용을 나열하고 Codex, Cursor 등 다른 에이전트가 사용할 수 있는 HTTP API를 언급합니다.
-
Kagura는 로그인 또는 검증 흐름을 어떻게 처리하나요? Kagura는 매직 링크, OTP, 이메일 검증을 위한 이메일 기능을 포함하여 브라우저 자동화가 일반적으로 사용자 이메일 액세스를 요구하는 단계를 완료합니다.
-
Kagura가 생성하는 테스트 아티팩트는 무엇인가요? 사이트에 따르면 액션 기록, 스크린샷 캡처, CI/CD 게시(기록된 액션 재생 포함)를 설명합니다.
-
Kagura는 셀프 호스팅인가 클라우드 호스팅인가요? 페이지에 따르면 자체 인프라에서 실행하는 셀프 호스팅과 CI/CD, 이메일 포함 클라우드 관리 호스팅 옵션 두 가지를 설명합니다.
대안
- 범용 브라우저 자동화 프레임워크 (예: Playwright/Selenium) + 커스텀 테스트 코드: UI 테스트를 자동화할 수 있지만, AI 에이전트 전용 하네스가 아닌 테스트 스크립트를 직접 작성·유지보수해야 합니다.
- UI/DOM 도구 내장 에이전트 프레임워크: 일부 에이전트 플랫폼에 브라우저 자동화나 도구가 포함되지만, 이메일 플로우 기능과 CI/CD 게시/재생 워크플로우 조합을 제공하지 않을 수 있습니다.
- 테스트 작성 중심 엔드투엔드 테스트 도구: E2E 스위트는 앱 동작을 검증하지만, 에이전트 주도 실행을 위한 기록/재생 대신 인간 작성 테스트 케이스에 중점을 둡니다.
- MCP 지원 자동화 서비스: MCP로 에이전트 오케스트레이션을 많이 사용한다면, 브라우저 제어를 노출하는 다른 MCP 도구를 찾을 수 있지만, 이메일 처리와 CI/CD 게시를 직접 조합해야 할 수 있습니다.
대안
Ably Chat
Ably Chat은 실시간 채팅 API와 SDK로 맞춤형 채팅 앱을 구축합니다. 반응, 존재감, 메시지 편집/삭제를 포함해 대규모 실시간에 최적화
AakarDev AI
AakarDev AI는 원활한 벡터 데이터베이스 통합을 통해 AI 애플리케이션 개발을 간소화하는 강력한 플랫폼으로, 신속한 배포와 확장성을 가능하게 합니다.
DeepMotion
DeepMotion은 웹 브라우저에서 비디오(및 텍스트)로부터 3D 애니메이션을 생성하는 AI 모션 캡처·바디 트래킹 플랫폼입니다. Animate 3D API 지원.
Arduino VENTUNO Q
Arduino VENTUNO Q는 로보틱스용 엣지 AI 컴퓨터로, AI 추론 하드웨어와 마이크로컨트롤러 제어를 한 보드에 통합합니다. Arduino App Lab로 개발 워크플로 제공
Devin
Devin은 AI 코딩 에이전트로 코드 마이그레이션과 대규모 리팩터링을 서브태스크 병렬로 수행해요. 엔지니어 승인 하에 진행
imgcook
imgcook은 디자인 목업을 클릭 한 번으로 고품질의 실제 운영 가능한 코드로 변환하는 지능형 도구입니다.