browse.sh icon

browse.sh

browse.sh는 브라우저 자동화 스킬 오픈 카탈로그이자 AI 에이전트용 CLI로, 웹사이트 제어, 세션 निरी검, 로컬·클라우드 브라우저 워크플로를 지원합니다. 개발자와 에이전트 빌더가 사이트별 레시피를 처음부터 다시 만들지 않고 재사용할 수 있게 돕습니다.

browse.sh

browse.sh란?

browse.sh는 브라우저 자동화 스킬의 오픈 카탈로그이자 AI 에이전트를 위한 브라우저 CLI입니다. 재사용 가능한 웹사이트별 스킬과 하위 수준의 브라우저 프리미티브, 디버깅 도구, 클라우드 세션을 결합해 에이전트가 웹사이트와 웹앱을 구조적으로 상호작용할 수 있게 합니다.

카탈로그는 특정 도메인과 작업을 위한 SKILL.md 레시피를 중심으로 구성됩니다. 또한 이 사이트는 스킬 추가, 셀렉터와 접근성 참조를 통한 페이지 제어, 네트워크 및 콘솔 출력 확인, 로컬 Chromium과 원격 Browserbase 세션 간 전환을 위한 예시 명령도 보여줍니다.

주요 기능

  • 특정 웹사이트와 작업을 위한 브라우저 자동화 스킬 오픈 카탈로그로, 계약 검색, 수업 예약, 항공편 상태, 리뷰, 트레일 검색 같은 항목을 포함합니다.
  • AI 에이전트가 웹사이트 작업을 완료하는 방법을 학습하도록 돕는 재사용 가능한 스킬 레시피를 설치하는 browse skills add 워크플로.
  • 페이지를 직접 조작할 수 있는 click, type, select, press, hover, scroll, mouse 등의 하위 수준 브라우저 제어.
  • 세션 중 네트워크와 콘솔 출력을 추적하는 디버깅 명령으로, 요청, 응답, 경고, 런타임 오류를 확인하는 데 도움이 됩니다.
  • 기본적으로 로컬 Chromium을 지원하며, 명령 앞에 cloud를 붙여 원격 세션과 Browserbase API를 사용할 수 있습니다.
  • 카탈로그 예시에 표시된 정식 URL, 상태 필드, 시간 범위, 평점 또는 기타 페이지 데이터 같은 사이트별 스킬의 구조화된 출력.

browse.sh 사용 방법

먼저 npm으로 CLI를 설치한 다음, 대상 웹사이트에 맞는 스킬을 설치하려면 browse skills add를 사용합니다. 그다음에는 클릭, টাই핑, 선택, 스크롤용 브라우저 명령으로 페이지를 제어하거나, 알려진 사이트의 바로 사용할 수 있는 레시피로 카탈로그 항목을 활용하면 됩니다.

동작을 확인해야 한다면 현재 세션의 네트워크나 콘솔을 추적하세요. 원격 워크플로의 경우 cloud 접두사를 사용해 Browserbase 세션을 만들거나 해당 검색 및 fetch API를 호출합니다.

사용 사례

  • AI 에이전트가 수업 예약이나 여행 사이트 검색처럼 반복적인 웹사이트 워크플로를 완료하기 위해 도메인별 레시피가 필요할 때.
  • 개발자가 명시적인 명령과 셀렉터를 통해 페이지 상호작용을 제어하면서 브라우저 작업을 자동화하고 싶을 때.
  • 사용자가 웹앱을 디버깅하면서 세션이 실행되는 동안 네트워크 호출과 콘솔 출력을 확인해야 할 때.
  • 전체 명령 스타일은 유지한 채 로컬 브라우저 자동화에서 원격 세션으로 전환해야 할 때.
  • 팀이 각 웹사이트마다 프롬프트를 다시 만들지 않고 에이전트 간에 공유할 수 있는 재사용 가능한 스킬 카탈로그를 원할 때.

FAQ

browse.sh는 무엇을 제공하나요? 브라우저 작업 실행, 세션 디버깅, 클라우드 기반 워크플로를 위한 CLI와 함께 브라우저 자동화 스킬의 오픈 카탈로그를 제공합니다.

로컬 브라우저에서만 작동하나요? 아니요. 페이지에는 명령이 로컬 Chromium에서 기본적으로 작동하며, 명령 앞에 cloud를 붙이면 원격 세션을 사용할 수 있다고 나와 있습니다.

이 문맥에서 브라우저 스킬은 무엇인가요? 스킬은 SKILL.md로 설명되는 재사용 가능한 레시피로, AI 에이전트가 특정 웹사이트에서 작업을 완료하는 방법을 알려줍니다.

browse.sh는 디버깅을 지원하나요? 네. 사이트는 네트워크와 콘솔 추적을 강조하며, 에이전트와 사람이 페이지가 실시간으로 무엇을 하는지 관찰할 수 있게 합니다.

카탈로그 항목이 모두 대화형 도구인가요? 반드시 그렇지는 않습니다. 페이지에는 API 기반, 브라우저 기반, 하이브리드 항목이 섞여 있으며, 상호작용 방식은 각 스킬에 따라 달라집니다.

대안

  • Playwright나 Puppeteer 같은 일반적인 브라우저 자동화 프레임워크로, 재사용 가능한 스킬 카탈로그를 제공하기보다 브라우저 동작을 직접 스크립팅하는 데 초점을 둡니다.
  • 자연어 지시를 웹 작업으로 변환하는 데 중점을 둔 에이전트/브라우저 오케스트레이션 도구로, 보통 공개 스킬 마켓플레이스는 포함하지 않습니다.
  • 특정 사이트나 워크플로 하나를 잘 해결할 수 있는 작업 전용 브라우저 봇이나 스크래핑 워크플로로, 공유 가능한 재사용 사이트 레시피 카탈로그는 제공하지 않습니다.
  • 호스팅된 브라우저 인프라와 세션 관리를 강조하는 클라우드 브라우저 플랫폼으로, browse.sh는 브라우저 제어와 스킬 카탈로그, CLI 워크플로를 결합합니다.