SlimSnap
SlimSnap ist eine macOS-App, die Screenshots in JSON für terminalbasierte Coding-Agenten und textbasierte Workflows umwandelt.
Was ist SlimSnap?
SlimSnap ist eine macOS-App, die Screenshots in JSON umwandelt, das terminalbasierte Coding-Agenten lesen können. Sie ist für Situationen gedacht, in denen Sie UI-Details an Tools wie Claude Code, Aider oder Codex CLI übermitteln möchten, ohne ein Bild einzufügen.
Der Workflow kombiniert Aufnehmen, Annotieren, OCR und Export. Nutzer wählen einen Bereich auf dem Bildschirm aus, fügen visuelle Markierungen wie Pfeile oder Callouts hinzu und kopieren eine strukturierte JSON-Darstellung, die Elementtext, Begrenzungsrahmen und Annotationsdaten enthält. Ziel ist es, Screenshot-Inhalte in reinen Textumgebungen verfügbar zu machen und den Aufnahmeprozess lokal auf dem Mac zu halten.
SlimSnap veröffentlicht außerdem ein offenes JSON-Schema auf GitHub unter der MIT-Lizenz, sodass das exportierte Format außerhalb der App validiert oder wiederverwendet werden kann. Die Produktseite positioniert es als Möglichkeit, Screenshot-Kontext an Orte zu bringen, an denen Bilder nicht akzeptiert werden, etwa Terminals, SSH-Sitzungen und andere textbasierte Workflows.
Wichtige Funktionen
- Native macOS-Bildschirmaufnahme: Nutzer drücken
⌘⇧S, ziehen, um einen Bereich auszuwählen, und lassen los, um einen Screenshot-Ausschnitt aufzunehmen. - Annotationstools: Pfeile, Callouts und Hervorhebungen helfen, den Agenten auf ein bestimmtes UI-Element oder Problem hinzuweisen.
- JSON-Export: Aufnahmen werden als strukturiertes JSON kopiert, damit sie in Terminal-Agenten und andere textbasierte Tools eingefügt werden können.
- OCR integriert: Die App liest sichtbare Labels, Buttons und Fehlermeldungen aus dem Screenshot und nimmt sie in die Ausgabe auf.
- Begrenzungsrahmen für Elemente: Ausgabeelemente enthalten normalisierte Koordinaten, was nachgelagerten Tools hilft, Layout und Position zu interpretieren.
- Lokale Verarbeitung auf dem Mac: Aufnahme und OCR laufen auf dem Gerät, ohne Konto oder Server-Upload.
- Offenes Schema: Das JSON-Schema wird auf GitHub unter MIT veröffentlicht und ermöglicht Validierung oder eigene Exporter.
So verwenden Sie SlimSnap
Installieren Sie die Mac-App und verwenden Sie dann die Aufnahme-Tastenkombination, um den Teil des Bildschirms auszuwählen, den Sie teilen möchten. Fügen Sie bei Bedarf Anmerkungen hinzu, um die Aufmerksamkeit zu lenken, etwa durch Hervorheben eines Buttons oder Markieren einer Fehlermeldung.
Kopieren Sie nach der Aufnahme das erzeugte JSON und fügen Sie es in ein Tool ein, das Text akzeptiert, etwa einen CLI-Coding-Agenten. Wenn Sie den Claude Code Skill verwenden, schreibt SlimSnap außerdem eine kleine lokale Config-Datei, damit der Skill die gespeicherten JSON-Aufnahmen automatisch findet.
Anwendungsfälle
- UI-Debugging in einem Terminal-Agenten: Teilen Sie einen Screenshot einer fehlerhaften Oberfläche, bei dem Layout- und Textdetails bereits in JSON extrahiert wurden.
- Iterative Code-Review- oder Fix-Prompts: Weisen Sie einen Agenten auf einen bestimmten Button, ein Formularfeld oder einen Fehlerzustand hin, ohne eine lange visuelle Beschreibung zu schreiben.
- SSH- oder Remote-Sitzungen: Verlegen Sie Screenshot-Kontext in eine Umgebung, in der kein Bild-Einfügen verfügbar ist.
- CI- oder Log-basiertes Troubleshooting: Fügen Sie strukturierten UI-Kontext in textbasierte Logs oder Commit-Messages ein, wenn ein Screenshot nicht passt.
- Eigene Workflows: Verwenden Sie das veröffentlichte Schema, um kompatibles JSON aus einer anderen OCR-Pipeline oder einem selbst geschriebenen Exporter zu erzeugen.
FAQ
Lädt SlimSnap meine Screenshots auf einen Server hoch? Nein. Die Seite sagt, dass Aufnahme und OCR lokal auf Ihrem Mac laufen und Screenshots das Gerät nicht verlassen.
Funktioniert es mit Tools, die keine Bilder lesen können? Ja. Das Produkt ist für Terminal-Agenten und andere textbasierte Ziele gedacht, bei denen Screenshots nicht direkt eingefügt werden können.
Ist das Schema offen? Ja. Das JSON-Schema wird auf GitHub unter MIT veröffentlicht, und die Seite sagt, dass auch der Claude Code Skill offen ist.
Brauche ich die Mac-App, um den Claude Code Skill zu verwenden? Nein. Der Skill kann mit jeder gültigen SlimSnap-JSON-Datei arbeiten, auch wenn sie außerhalb der App erstellt wurde.
Ist SlimSnap unter Windows oder Linux verfügbar? Derzeit nicht. Auf der Seite steht, dass es heute nur für Mac verfügbar ist, und es werden Anfragen für andere Plattformen begrüßt.
Alternativen
- Native Screenshot-Freigabe in KI-Chat-Apps: nützlich für einmalige Bildfragen, aber nicht für Terminal-Agenten oder textbasierte Workflows ausgelegt.
- Manuelle Textbeschreibungen der UI: praktikabel, wenn der Screenshot einfach ist, aber langsamer und fehleranfälliger bei komplexen Layouts.
- OCR plus eigene JSON-Exporter: eine flexible Option für Teams, die ihre eigene Pipeline von Screenshots zu strukturiertem Text aufbauen möchten.
- Allgemeine Bildschirmaufnahme- oder Annotationstools: können Oberflächen erfassen und markieren, exportieren aber meist kein agentenlesbares JSON mit OCR und Begrenzungsrahmen.
Alternativen
Ably Chat
Ably Chat ist eine Chat-API und SDKs für maßgeschneiderte Realtime-Chat-Apps: Reactions, Presence sowie Nachrichten editieren/löschen.
AakarDev AI
AakarDev AI ist eine leistungsstarke Plattform, die die Entwicklung von KI-Anwendungen mit nahtloser Integration von Vektordatenbanken vereinfacht und eine schnelle Bereitstellung und Skalierbarkeit ermöglicht.
DeepMotion
DeepMotion ist eine AI-Motion-Capture- und Body-Tracking-Plattform für 3D-Animationen aus Video (und Text) im Browser – per Animate 3D API integrierbar.
Arduino VENTUNO Q
Arduino VENTUNO Q ist ein Edge-AI-Computer für Robotik und physische Systeme: KI-Inferenz mit Microcontroller für deterministische Steuerung. Entwickeln in Arduino App Lab.
Devin
Devin ist ein AI-Coding-Agent für Softwareteams: unterstützt Parallelisierung von Migrations- und Refactoring-Subtasks, während Engineers steuern und Änderungen freigeben.
MakerLoft
MakerLoft: KI-App-Builder für Nicht-Entwickler. Verbindet sich mit deinem GitHub-Repo und generiert lauffähige Apps inkl. Backend, Auth & Payments.