Raindrop
Raindrop Workshop은 AI 에이전트를 위한 로컬 디버거로, 실행 트레이스를 실시간 스트리밍합니다. Claude Code로 에이전트 eval을 작성·실행하세요.
Raindrop이란?
Raindrop의 Workshop은 AI 에이전트를 위한 로컬 디버거로, 에이전트 동작을 관찰하고 에이전트 eval로 검증하도록 설계되었습니다. 에이전트가 localhost에서 실행되는 동안 토큰과 도구 호출을 포함한 실시간 스트리밍으로 에이전트의 작업을 확인할 수 있어 결정 과정을 실시간으로 볼 수 있습니다.
워크플로우는 Claude Code를 중심으로 합니다: Workshop은 에이전트 실행에서 트레이스를 기록하고, Claude Code는 해당 동작에 대한 평가 테스트를 작성·실행하며—선택적으로 실패 시 코드 변경과 재실행을 반복하는 self-healing 루프에서 단언문이 통과할 때까지 진행합니다.
주요 기능
- localhost에서 실시간 스트리밍 에이전트 트레이스: 에이전트 실행 중 모든 토큰, 도구 호출, 결정을 폴링이나 페이지 새로고침 없이 Workshop으로 스트리밍하여 확인.
- 디버깅을 위한 궤적 + 트레이스 보기: 인터페이스에서 “Overview,” “Span Tree,” “Comms” 등의 트레이스를 보여 에이전트의 추론 과정과 호출된 도구를 검사.
- Claude Code와 통합: Claude Code가 Workshop 트레이스를 읽어 에이전트 eval을 생성하고 평가 결과를 바탕으로 코드를 업데이트.
- 재실행 및 반복 가능한 eval: 테스트 작성, 실행, 검증(예: 후속 질문이나 동작에 대한 단언문)을 지원하며, 수정 후 재실행.
- 일반적인 에이전트/코딩 생태계와 함께 작동: Vercel AI SDK, OpenAI SDK, Anthropic SDK, LangChain, LlamaIndex, CrewAI, Mastra 및 Claude Code CLI, Cursor, OpenCode 등의 도구와 호환.
Raindrop 사용 방법
- 제공된 스크립트로 Workshop 설치:
curl -fsSL https://raindrop.sh/install | bash - 로컬에서 Workshop 시작하고 에이전트를 실행해 로컬 서버(
localhost:5899엔드포인트)에 연결. - Workshop 열기로 에이전트 실행 중 트레이스 스트리밍 확인.
- 트레이스 데이터를 바탕으로 Claude Code로 eval 작성·실행. eval 실패 시 Claude Code가 변경을 가하고 단언문 통과까지 에이전트 재실행(스트리밍 예시 참조).
사용 사례
- 필수 후속 질문을 건너뛰는 에이전트 디버깅: 트레이스 기록 후 후속 질문 단언문을 포함한 eval 실행, Claude Code로 프롬프트나 로직 업데이트하여 eval 통과.
- 여러 세션에서 도구 호출 동작 검증: 트레이스 목록의 여러 “agent sessions” 비교로 일관성 확인.
- 에이전트 프롬프트용 타겟 회귀 검사 생성: “진단으로 바로 넘어가지 않음” 등의 eval 테스트로 프롬프트 변경 시 이전 수정 문제 재발 방지.
- 실행 comms와 span 구조 검사: 실패 전 에이전트 동작과 도구 호출을 “Comms” 및 “Span Tree” 뷰로 검토.
- 다중 프레임워크 에이전트 개발 지원: 페이지에 나열된 SDK/프레임워크(LangChain/LlamaIndex/CrewAI 등)로 에이전트 빌드 시 로컬 디버깅 유지하며 기존 에이전트 스택 사용.
자주 묻는 질문
-
Workshop은 Claude Code 전용인가요? 페이지에서 Claude Code 통합 강조: Claude Code가 트레이스를 읽어 eval 작성·실행. Workshop 자체는 로컬 디버거로 위치지음; eval 작성 루프는 Claude Code로 구체화.
-
“실시간 스트리밍 트레이스”란? 페이지에서 폴링이나 새로고침 없이 “모든 토큰, 모든 도구 호출, 모든 결정”을
localhost:5899연결로 Workshop에 스트리밍한다고 설명. -
어떤 프로그래밍 언어나 프레임워크를 지원하나요? 페이지에서 TypeScript, Python 호환 나열, Rust와 Go 언급, Vercel AI SDK, OpenAI SDK, Anthropic SDK, LangChain, LlamaIndex, CrewAI, Mastra 지원.
-
Workshop에서 에이전트 eval은 어떻게 작동하나요? 표시된 예시에서 트레이스로 eval 테스트(단언문) 생성, 테스트 실행, 실패 시 코드 수정 후 단언문 통과까지 에이전트 재실행.
대안
- 에이전트 실행용 로컬 로깅 + 테스트 하네스: 트레이스 뷰어와 통합 eval 루프 대신 도구 호출/토큰 로깅 계측과 에이전트 출력 주변 단위/통합 테스트 자체 구축.
- 기타 AI 에이전트 관찰성 도구: 에이전트 실행 모니터링과 트레이스 시각화 중심 도구; 통합 eval 작성·반복 루프 지원 여부에 따라 차이.
- 프레임워크 내장 디버깅: 특정 스택(LangChain/LlamaIndex 등) 사용 시 내장 트레이싱/로깅에 의존하고 eval 스크립트를 별도 생성, 전용 로컬 디버거 Workshop 대신 사용.
대안
Codex Plugins
Codex Plugins로 스킬, 앱 통합, MCP 서버를 재사용 워크플로로 묶어 Gmail·Google Drive·Slack 같은 도구 접근을 확장하세요.
ClawTick
ClawTick은 크론 스케줄로 웹훅 태스크를 실행하는 CLI-first AI 에이전트 자동화 플랫폼입니다. 모니터링·알림·재시도·실행 로그 제공
Falconer
Falconer는 고속 팀을 위한 자체 업데이트 지식 플랫폼으로, 내부 문서와 코드 맥락을 한곳에서 작성·공유·찾아보세요.
OpenFlags
OpenFlags는 오픈소스 셀프호스팅 피처 플래그 시스템으로, 앱 SDK에서 로컬 평가와 REST 제어 플레인을 통해 안전한 점진적 배포를 지원합니다.
AakarDev AI
AakarDev AI는 원활한 벡터 데이터베이스 통합을 통해 AI 애플리케이션 개발을 간소화하는 강력한 플랫폼으로, 신속한 배포와 확장성을 가능하게 합니다.
Whirr
Whirr는 조용한 macOS 메뉴 막대 앱으로, Claude Code 에이전트 활동을 Mac 노치에 그대로 반영해 화면을 보지 않고도 한눈에 확인하세요.