SlimSnap
SlimSnapは、スクリーンショットをJSONに変換するmacOSアプリです。CLIのコーディングエージェントやテキストのみの作業で、UI文脈を画像なしで渡せます。
SlimSnapとは?
SlimSnapは、スクリーンショットをターミナルベースのコーディングエージェントが読み取れるJSONに変換するmacOSアプリです。Claude Code、Aider、Codex CLIのようなツールにUIの詳細を画像なしで伝えたい場面向けに設計されています。
このワークフローは、キャプチャ、注釈、OCR、エクスポートを組み合わせています。ユーザーは画面上の範囲を選択し、矢印や吹き出しなどの視覚的なマーカーを追加して、要素テキスト、バウンディングボックス、注釈データを含む構造化JSON表現をコピーできます。目的は、Mac上でのローカルなキャプチャ処理を保ちながら、スクリーンショットの内容をテキスト専用環境でも扱えるようにすることです。
SlimSnapはMITライセンスのもと、GitHubでオープンなJSONスキーマも公開しています。そのため、書き出した形式はアプリ外でも検証や再利用が可能です。製品ページでは、ターミナル、SSHセッション、その他のテキストのみのワークフローなど、画像を受け付けない場所へスクリーンショットの文脈を持ち込む手段として位置づけられています。
主な機能
- macOSネイティブの画面キャプチャ:
⌘⇧Sを押し、ドラッグで範囲を選択し、離すとスクリーンショット領域をキャプチャします。 - 注釈ツール: 矢印、吹き出し、ハイライトで、エージェントに特定のUI要素や問題箇所を指し示せます。
- JSONエクスポート: キャプチャは構造化JSONとしてコピーされ、ターミナルエージェントやその他のテキスト専用ツールに貼り付けられます。
- OCR内蔵: アプリがスクリーンショット内の表示ラベル、ボタン、エラーメッセージを読み取り、出力に含めます。
- 要素のバウンディングボックス: 出力要素には正規化された座標が含まれ、下流ツールがレイアウトや位置を把握しやすくなります。
- Mac上でのローカル処理: キャプチャとOCRは端末上で実行され、アカウント登録やサーバーへのアップロードは不要です。
- オープンスキーマ: JSONスキーマはMITでGitHubに公開されており、検証や独自エクスポーターに利用できます。
SlimSnapの使い方
Macアプリをインストールし、キャプチャ用ショートカットで共有したい画面部分を選択します。ボタンの強調やエラーメッセージのマーキングなど、注目を促すために必要な注釈を追加します。
キャプチャ後、生成されたJSONをコピーし、CLIコーディングエージェントのようなテキストを受け付けるツールに貼り付けます。Claude Codeのスキルを使う場合、SlimSnapは小さなローカル設定ファイルも書き込み、保存済みのJSONキャプチャをスキルが自動で見つけられるようにします。
用途
- ターミナルエージェントでのUIデバッグ: 壊れたインターフェースのスクリーンショットを、レイアウトとテキスト情報がJSONに抽出された状態で共有できます。
- 反復的なコードレビューや修正プロンプト: 長い見た目の説明を書かずに、特定のボタン、入力欄、エラー状態をエージェントに指示できます。
- SSHやリモートセッション: 画像の貼り付けができない環境へ、スクリーンショットの文脈を移せます。
- CIやログベースのトラブルシューティング: スクリーンショットが収まりきらない場面でも、構造化されたUI文脈をテキストのみのログやコミットメッセージに貼り付けられます。
- 独自のワークフロー: 公開されたスキーマを使って、別のOCRパイプラインや手書きエクスポーターから互換JSONを生成できます。
FAQ
SlimSnapはスクリーンショットをサーバーにアップロードしますか? いいえ。ページでは、キャプチャとOCRはMac上でローカルに実行され、スクリーンショットは端末から外に出ないと説明されています。
画像を読めないツールでも使えますか? はい。製品はターミナルエージェントや、スクリーンショットを直接貼り付けられないテキスト専用の送信先向けに作られています。
スキーマはオープンですか? はい。JSONスキーマはMITでGitHubに公開されており、ページではClaude Codeのスキルもオープンだと説明されています。
Claude Codeのスキルを使うのにMacアプリは必要ですか? いいえ。スキルは、アプリ外で作成されたものでも、有効なSlimSnap JSONファイルなら使えます。
SlimSnapはWindowsやLinuxで使えますか? 現在は使えません。ページでは現時点でMac専用とされ、他プラットフォームの要望も受け付けています。
代替手段
- AIチャットアプリの標準スクリーンショット共有: 単発の画像質問には便利ですが、ターミナルエージェントやテキストのみのワークフロー向けではありません。
- UIの手動テキスト説明: シンプルなスクリーンショットなら可能ですが、詳細なレイアウトでは遅く、ミスも起きやすいです。
- OCRと独自JSONエクスポーター: スクリーンショットから構造化テキストへの独自パイプラインを作りたいチーム向けの柔軟な選択肢です。
- 一般的な画面録画や注釈ツール: インターフェースのキャプチャやマーキングはできますが、通常はOCRやバウンディングボックス付きのエージェント可読JSONは出力しません。
代替品
Ably Chat
Ably Chatはカスタムリアルタイムチャット用のAPI/SDK。リアクション、プレゼンス、メッセージ編集/削除に対応し高負荷も設計。
AakarDev AI
AakarDev AIは、シームレスなベクターデータベース統合を通じてAIアプリケーションの開発を簡素化し、迅速な展開とスケーラビリティを実現する強力なプラットフォームです。
DeepMotion
DeepMotionはAIモーションキャプチャ/ボディトラッキングで、動画(テキストも可)からWebブラウザで3Dアニメを生成。Animate 3D API連携も。
Arduino VENTUNO Q
Arduino VENTUNO Qはロボット向けエッジAIコンピュータ。AI推論とマイコン制御を統合し、Arduino App Labで埋め込み/ Linux/エッジAI開発。
Devin
Devinは、AIコーディングエージェントとして移行や大規模リファクタのサブタスクを並列実行。人が管理し変更を承認。
MakerLoft
MakerLoftは開発不要でAIがGitHub連携し、認証・決済・ファイルアップロード・定期処理・管理画面などの機能付きアプリを生成。