SlimSnap
SlimSnap — приложение для macOS, которое превращает скриншоты в JSON для терминальных coding-агентов и текстовых workflows.
Что такое SlimSnap?
SlimSnap — это приложение для macOS, которое превращает скриншоты в JSON, понятный терминальным coding-агентам. Оно предназначено для случаев, когда нужно передать детали интерфейса в такие инструменты, как Claude Code, Aider или Codex CLI, не вставляя изображение.
Рабочий процесс объединяет захват, аннотации, OCR и экспорт. Пользователь выделяет область на экране, добавляет визуальные пометки вроде стрелок или выносок и копирует структурированный JSON, который включает текст элементов, ограничивающие рамки и данные аннотаций. Цель — сделать содержимое скриншотов доступным в текстовых средах, сохраняя весь процесс захвата локально на Mac.
SlimSnap также публикует открытый JSON schema на GitHub под лицензией MIT, поэтому экспортируемый формат можно валидировать или использовать вне приложения. На странице продукта его позиционируют как способ перенести контекст скриншота туда, где изображения не принимаются, например в терминалы, SSH-сессии и другие текстовые workflows.
Ключевые возможности
- Нативный захват экрана macOS: пользователь нажимает
⌘⇧S, перетаскивает курсор, чтобы выделить область, и отпускает для захвата фрагмента экрана. - Инструменты аннотаций: стрелки, выноски и подсветка помогают указать агенту на конкретный элемент интерфейса или проблему.
- Экспорт в JSON: снимки копируются как структурированный JSON, чтобы их можно было вставлять в терминальные агенты и другие текстовые инструменты.
- Встроенный OCR: приложение распознаёт видимые подписи, кнопки и сообщения об ошибках на скриншоте и включает их в результат.
- Ограничивающие рамки элементов: в выводе для элементов используются нормализованные координаты, что помогает downstream-инструментам понимать макет и расположение.
- Локальная обработка на Mac: захват и OCR выполняются на устройстве, без аккаунта и без загрузки на сервер.
- Открытая схема: JSON schema опубликована на GitHub под MIT, что позволяет выполнять валидацию или делать собственные экспортёры.
Как использовать SlimSnap
Установите приложение для Mac, затем используйте сочетание для захвата, чтобы выделить нужную часть экрана. Добавьте необходимые аннотации, чтобы направить внимание, например подсветите кнопку или отметьте сообщение об ошибке.
После захвата скопируйте сгенерированный JSON и вставьте его в инструмент, который принимает текст, например в CLI coding-agent. Если вы используете Claude Code skill, SlimSnap также записывает небольшой локальный файл конфигурации, чтобы skill мог автоматически находить сохранённые JSON-скриншоты.
Сценарии использования
- Отладка UI в терминальном агенте: передайте скриншот сломанного интерфейса, уже с извлечёнными в JSON данными о макете и тексте.
- Итеративные запросы на code review или исправление: укажите агенту на конкретную кнопку, поле формы или состояние ошибки, не описывая всё длинным визуальным текстом.
- SSH или удалённые сессии: перенесите контекст скриншота в среду, где нельзя вставить изображение.
- Отладка через CI или логи: вставляйте структурированный UI-контекст в текстовые логи или сообщения коммитов, когда скриншот неуместен.
- Пользовательские workflows: используйте опубликованную схему, чтобы генерировать совместимый JSON из другого OCR-пайплайна или собственного экспортёра.
FAQ
SlimSnap загружает мои скриншоты на сервер? Нет. На странице сказано, что захват и OCR выполняются локально на вашем Mac, и скриншоты не покидают устройство.
Он работает с инструментами, которые не умеют читать изображения? Да. Продукт создан для терминальных агентов и других текстовых назначений, где скриншоты нельзя вставить напрямую.
Схема открытая? Да. JSON schema опубликована на GitHub под MIT, и на странице указано, что Claude Code skill тоже открыт.
Нужно ли приложение для Mac, чтобы использовать Claude Code skill? Нет. Skill может работать с любым корректным файлом SlimSnap JSON, даже если он был создан вне приложения.
Доступен ли SlimSnap для Windows или Linux? Пока нет. На странице сказано, что сейчас это только Mac-версия, и предлагается отправлять запросы на другие платформы.
Альтернативы
- Нативная отправка скриншотов в AI chat apps: подходит для разовых вопросов по изображению, но не рассчитана на терминальные агенты или текстовые workflows.
- Ручные текстовые описания интерфейса: workable, когда скриншот простой, но медленнее и чаще ошибается на сложных макетах.
- OCR плюс собственные JSON-exporters: гибкий вариант для команд, которые хотят построить свой pipeline от скриншотов к структурированному тексту.
- Общие инструменты записи экрана или аннотаций: могут захватывать интерфейсы и делать пометки, но обычно не экспортируют агентам читаемый JSON с OCR и bounding boxes.
Альтернативы
Ably Chat
Ably Chat — chat API и SDK для кастомных realtime-приложений: реакции, presence и правка/удаление сообщений для чатов в масштабе.
AakarDev AI
AakarDev AI — это мощная платформа, которая упрощает разработку приложений ИИ с бесшовной интеграцией векторных баз данных, позволяя быстрое развертывание и масштабируемость.
DeepMotion
DeepMotion — платформа ИИ для motion capture и body-tracking: создавайте 3D-анимации из видео (и текста) в браузере; интеграция через Animate 3D API.
Arduino VENTUNO Q
Arduino VENTUNO Q — edge AI компьютер для робототехники: ускоренный вывод нейросетей и микроконтроллер для детерминированного управления. Через Arduino App Lab.
Devin
Devin — AI coding-агент для команд: помогает завершать миграции и крупные рефакторинги, выполняя подзадачи параллельно под контролем инженеров.
MakerLoft
MakerLoft — AI-конструктор приложений: подключает GitHub и генерирует рабочие приложения с бэкендом (auth, платежи, загрузки, админ).