browse.sh
browse.sh — открытый каталог навыков браузерной автоматизации и CLI для AI-агентов: управление сайтами, сессиями и локальными или облачными браузерными workflow.
Что такое browse.sh?
browse.sh — это открытый каталог навыков браузерной автоматизации и browser CLI для AI-агентов. Он объединяет переиспользуемые навыки для конкретных сайтов с низкоуровневыми браузерными примитивами, инструментами отладки и облачными сессиями, чтобы агенты могли взаимодействовать с сайтами и веб-приложениями в структурированном виде.
Каталог организован вокруг рецептов SKILL.md для конкретных доменов и задач. На сайте также показаны примеры команд для добавления навыков, управления страницами через селекторы и accessibility-ссылки, просмотра сетевого и консольного вывода, а также переключения между локальным Chromium и удалёнными сессиями Browserbase.
Ключевые возможности
- Открытый каталог навыков браузерной автоматизации для конкретных сайтов и задач, с примерами вроде поиска контрактов, записи на занятия, статуса рейсов, отзывов и поиска троп.
- Рабочий процесс
browse skills addдля установки переиспользуемых рецептов навыков, которые учат AI-агентов выполнять действия на сайтах. - Низкоуровневые браузерные команды, включая действия
click,type,select,press,hover,scrollиmouseдля прямого взаимодействия со страницей. - Команды отладки для отслеживания сетевого и консольного вывода во время сессии, что помогает просматривать запросы, ответы, предупреждения и ошибки выполнения.
- Поддержка локального Chromium по умолчанию с возможностью добавлять префикс
cloudдля использования удалённых сессий и Browserbase APIs. - Структурированные результаты из навыков для конкретных сайтов, такие как канонические URL, поля статуса, временные окна, рейтинги или другие данные страницы, показанные в примерах каталога.
Как использовать browse.sh
Начните с установки CLI через npm, затем используйте browse skills add, чтобы установить навыки, релевантные вашим целевым сайтам. После этого управляйте страницами с помощью браузерных команд для кликов, ввода, выбора и прокрутки или используйте записи каталога как готовые рецепты для известных сайтов.
Если нужно проверить поведение, отслеживайте сеть или консоль активной сессии. Для удалённых workflow используйте префикс cloud, чтобы создать сессию Browserbase или вызвать её APIs поиска и получения.
Сценарии использования
- AI-агенту нужен доменно-специфичный рецепт, чтобы выполнить повторяющийся workflow на сайте, например записаться на занятие или выполнить поиск на туристическом сайте.
- Разработчик хочет автоматизировать браузерную задачу, сохраняя контроль над действиями на странице через явные команды и селекторы.
- Пользователь отлаживает веб-приложение и хочет наблюдать сетевые вызовы и вывод консоли, пока сессия выполняется.
- Workflow нужно перевести с локальной браузерной автоматизации на удалённую сессию без изменения общего стиля команд.
- Команде нужен переиспользуемый каталог навыков, которым можно делиться между агентами вместо пересборки промптов для каждого сайта.
FAQ
Что предоставляет browse.sh? Он предоставляет открытый каталог навыков браузерной автоматизации и CLI для запуска браузерных действий, отладки сессий и cloud-based workflow.
Он работает только с локальными браузерами?
Нет. На странице указано, что команды нативно работают с локальным Chromium, а удалённые сессии доступны через префикс cloud.
Что такое browser skill в этом контексте?
Skill — это переиспользуемый рецепт, описанный в SKILL.md, который учит AI-агента выполнять задачу на конкретном сайте.
Поддерживает ли browse.sh отладку? Да. На сайте выделены отслеживание сети и консоли, чтобы агенты и люди могли наблюдать за тем, что происходит на странице, в реальном времени.
Все ли записи каталога — это интерактивные инструменты? Не обязательно. На странице показана смесь API-backed, browser-based и hybrid записей, поэтому режим взаимодействия зависит от конкретного навыка.
Альтернативы
- Общие фреймворки для браузерной автоматизации, такие как Playwright или Puppeteer, которые ориентированы на прямое программирование поведения браузера, а не на каталог переиспользуемых навыков.
- Инструменты для orchestration agent/browser, которые фокусируются на преобразовании инструкций на естественном языке в веб-действия, часто без публичного marketplace навыков.
- Специализированные браузерные боты или scraping workflows, которые могут хорошо решать одну задачу или один сайт, но не дают общего каталога переиспользуемых рецептов для сайтов.
- Облачные браузерные платформы, которые делают акцент на хостинговой инфраструктуре браузеров и управлении сессиями, тогда как browse.sh объединяет управление браузером с каталогом навыков и CLI-workflow.
Альтернативы
AakarDev AI
AakarDev AI — это мощная платформа, которая упрощает разработку приложений ИИ с бесшовной интеграцией векторных баз данных, позволяя быстрое развертывание и масштабируемость.
Arduino VENTUNO Q
Arduino VENTUNO Q — edge AI компьютер для робототехники: ускоренный вывод нейросетей и микроконтроллер для детерминированного управления. Через Arduino App Lab.
Devin
Devin — AI coding-агент для команд: помогает завершать миграции и крупные рефакторинги, выполняя подзадачи параллельно под контролем инженеров.
open-codex-computer-use
open-codex-computer-use — open-source служба «Computer Use» в виде MCP-сервера: AI-агенты управляют GUI на macOS, Linux и Windows.
Codex Plugins
Используйте Codex Plugins, чтобы объединять skills, интеграции приложений и MCP-серверы в повторно используемые сценарии для доступа к Gmail, Google Drive и Slack.
Ably Chat
Ably Chat — chat API и SDK для кастомных realtime-приложений: реакции, presence и правка/удаление сообщений для чатов в масштабе.