browse.sh icon

browse.sh

browse.sh 是一個開放的瀏覽器自動化技能目錄與 AI 代理 CLI,可用來控制網站、檢查工作階段,並使用本機或雲端瀏覽器流程,協助開發者與代理建構者重用特定網站的操作範本。

browse.sh

browse.sh 是什麼?

browse.sh 是一個開放的瀏覽器自動化技能目錄與供 AI 代理使用的瀏覽器 CLI。它結合可重用的網站專屬技能、較低階的瀏覽器原語、除錯工具,以及雲端工作階段,讓代理能以結構化方式與網站和網頁應用互動。

這個目錄以針對特定領域與任務的 SKILL.md 範本為核心。網站也展示了新增技能、透過選擇器與無障礙參考控制頁面、檢視網路與主控台輸出,以及在本機 Chromium 和遠端 Browserbase 工作階段之間切換的範例指令。

主要特色

  • 針對特定網站與任務的開放瀏覽器自動化技能目錄,條目包含合約搜尋、課程預約、航班狀態、評論與步道搜尋等。
  • browse skills add 工作流程,可安裝教導 AI 代理如何完成網站操作的可重用技能範本。
  • 低階瀏覽器控制,包含 clicktypeselectpresshoverscrollmouse 等動作,可直接與頁面互動。
  • 除錯指令可在工作階段期間串流網路與主控台輸出,協助檢視請求、回應、警告與執行階段錯誤。
  • 預設支援本機 Chromium,並可在指令前加上 cloud 使用遠端工作階段與 Browserbase APIs。
  • 來自網站專屬技能的結構化輸出,例如標準 URL、狀態欄位、時間範圍、評分或目錄範例中顯示的其他頁面資料。

如何使用 browse.sh

先用 npm 安裝 CLI,接著使用 browse skills add 安裝與目標網站相關的技能。之後可用瀏覽器指令來點擊、輸入、選取與捲動頁面,或直接把目錄條目當作現成的已知網站範本。

如果需要檢查行為,可串流目前工作階段的網路或主控台輸出。對於遠端流程,使用 cloud 前綴建立 Browserbase 工作階段,或呼叫其 search 與 fetch APIs。

使用情境

  • AI 代理需要特定領域的範本,來完成重複性的網站工作流程,例如預約課程或搜尋旅遊網站。
  • 開發者想自動化瀏覽器任務,同時透過明確指令與選擇器保留對頁面互動的控制。
  • 使用者正在除錯網頁應用,並需要在工作階段執行時觀察網路呼叫與主控台輸出。
  • 工作流程需要從本機瀏覽器自動化切換到遠端工作階段,且不必改變整體指令風格。
  • 團隊想要一個可重用的技能目錄,讓不同代理之間可以共享,而不是為每個網站重新撰寫提示詞。

常見問題

browse.sh 提供什麼? 它提供一個開放的瀏覽器自動化技能目錄,以及用於執行瀏覽器動作、除錯工作階段與雲端工作流程的 CLI。

它只支援本機瀏覽器嗎? 不是。頁面指出指令可原生搭配本機 Chromium 使用,且只要在指令前加上 cloud 就能使用遠端工作階段。

這裡的 browser skill 是什麼? skill 是一個可重用的範本,以 SKILL.md 描述,用來教 AI 代理如何在特定網站上完成任務。

browse.sh 支援除錯嗎? 有。網站強調可串流網路與主控台輸出,讓代理與人類都能即時觀察頁面正在做什麼。

目錄條目都是互動式工具嗎? 不一定。頁面展示了由 API 驅動、瀏覽器式與混合式條目,因此互動模式取決於特定 skill。

替代方案

  • 一般瀏覽器自動化框架,例如 Playwright 或 Puppeteer,這類工具偏向直接以腳本控制瀏覽器行為,而不是提供可重用技能目錄。
  • 代理/瀏覽器協調工具,著重將自然語言指令轉換為網頁動作,但通常沒有公開的技能市集。
  • 任務專用的瀏覽器機器人或擷取流程,可能能很好地解決單一網站或單一流程,但不提供可共享的可重用網站範本目錄。
  • 雲端瀏覽器平台,重點在託管瀏覽器基礎架構與工作階段管理;而 browse.sh 結合了瀏覽器控制、技能目錄與 CLI 工作流程。