Capso
Capso ist eine kostenlose Open-Source-macOS-App zum Screenshot, Annotations-Editor, Aufnehmen von MP4/GIF und Textextraktion per OCR – mit Swift 6 & SwiftUI.
Was ist Capso?
Capso ist eine kostenlose Open-Source-App für Screenshots und Screen-Recording für macOS. Sie ersetzt den typischen Workflow aus Screenshot, Annotation, Video- oder GIF-Aufnahme und Textextraktion – mit einer nativen macOS-App, gebaut mit Swift 6 und SwiftUI.
Statt getrennter Tools kombiniert Capso Aufnahmemodi (Bereich, Fenster, Vollbild), einen Annotations-Editor, OCR-Texterkennung und Aufnahme-/Verschönerungsfunktionen in einer Oberfläche. Das Projekt ist als Open Source verfügbar und dauerhaft kostenlos, ohne Testphase und ohne Abos.
Wichtige Funktionen
- Bereichs-, Fenster- und Vollbildaufnahme: Aufnehmen über Menüleiste oder globales Shortcut, inklusive schneller Fensteraufnahmen und Drag-to-Select mit Live-Maßband-Overlay.
- Screen-Recording als MP4 und GIF: Video oder GIFs mit System-Audio und Mikrofon aufnehmen, optional mit Webcam Picture-in-Picture-Overlay.
- Webcam-PiP-Overlay (4 Formen): Verschiebbarer Webcam-Overlay beim Aufnehmen in Kreis/Quadrat/Portrait/Landschaft-Formen, mit Snap-to-Corner-Positionierung und Klick-zum-Vergrößern-Vollbildansicht.
- Annotations-Editor für Markierungen: Aufgenommene Bilder mit Pfeilen, Rechtecken, Ellipsen, Text, Freihandzeichnen, Pixelierung/Weichzeichnen, nummerierten Zählern und Textmarkern versehen, mit Undo/Redo und Farbwähler.
- OCR-Texterkennung: Bereich auswählen, um Text zu erkennen und zu kopieren; Capso hebt erkannte Textblöcke hervor, um selektives Kopieren zu erleichtern.
- Screenshot-Verschönerung: Rohe Aufnahmen in gestylte Visuals umwandeln mit Hintergrundverläufen, Abständen, abgerundeten Ecken und Schatten, wählbar „Solid“ oder „Liquid Glass“-Stil mit Echtzeit-Vorschau.
- Konfigurierbare Einstellungen und Tastenkürzel: Screenshot-/Recording-Formate und -Qualität festlegen, Hotkeys anpassen, Schnellzugriff-Verhalten und Export-Voreinstellungen steuern.
- Schnellzugriff und Nach-Aufnahme-Aktionen: Nach Aufnahme schwebende Vorschau nutzen zum Kopieren, Speichern, Annotieren, OCR, Pinnen und Drag-and-Drop.
- An Bildschirm pinnen: Aufnahmen als immer im Vordergrund-Referenz-Overlays behalten, mit Sperrmodus für Click-Through-Referenz.
- Gebaut mit Swift 6 / SwiftUI und Open Source: Die App ist mit Swift 6 und SwiftUI entwickelt und als Open-Source-Code über GitHub verfügbar.
So nutzt du Capso
- Herunterladen und installieren: Capso aus den GitHub-Releases (DMG) laden oder aus dem Quellcode bauen.
- Aufnahmemodus wählen: Über Menüleiste oder globales Shortcut: Bereich, Fenster oder Vollbild.
- Bei Screenshots Aufnahme im Annotations-Editor öffnen, um Markierungen hinzuzufügen, oder Verschönerungsstile fürs Teilen anwenden.
- Bei Recording Bereich wählen, MP4- oder GIF-Aufnahme starten (optional mit Webcam-PiP), und Pause/Resume/Restart-Steuerungen nutzen.
- OCR nutzen, indem du einen Bereich auswählst, um Text zu erkennen und zu kopieren, dann Schnellzugriff-Aktionen (kopieren, speichern, annotieren, OCR oder pinnen) aus der Nach-Aufnahme-Vorschau anwenden.
Anwendungsfälle
- Dokumentation und Tutorials: Spezifischen UI-Bereich aufnehmen, mit Pfeilen/Text/Callouts annotieren und Verschönerung (Abstände, abgerundete Ecken, Schatten) für einheitliche Visuals anwenden.
- Bug-Reporting: MP4 oder GIF (mit System-Audio und Mikrofon) der Schritte aufnehmen, dann sensible Teile markieren oder pixelieren/weichzeichnen, bevor du teilst.
- Textauszug aus Screenshots: Bildschirmbereich mit Text auswählen und erkannte Textblöcke mit Capso-OCR kopieren.
- Live-Referenz beim Arbeiten: Aufnahme als immer im Vordergrund-Overlay ans Bildschirm pinnen; Sperrmodus für Click-Through-Referenz bei Nutzung anderer Apps.
- Screen-Präsentationen und Demos: Video mit Webcam-PiP in gewählter Form und Position aufnehmen, mit konfigurierbaren Steuerungen und globalen Shortcuts für reibungslose Aufnahme.
FAQ
Ist Capso kostenlos nutzbar?
Ja. Capso ist dauerhaft kostenlos ohne Testphase, ohne Feature-Sperren und ohne Abos.
Kann ich Capso beruflich nutzen?
Die FAQ besagt, dass persönliche und interne Firmennutzung unter der BSL 1.1-Lizenz voll erlaubt ist, mit Einschränkung gegen Forking und Verkauf als konkurrierendes kommerzielles Screen-Capture-Produkt.
Unterstützt Capso OCR?
Ja. Du kannst einen Bereich auswählen, um Text zu erkennen und zu kopieren. Visuelle Hervorhebung der Textblöcke erleichtert selektives Kopieren.
Welche Recording-Formate werden unterstützt?
Capso nimmt Video (MP4) und GIF auf und unterstützt System-Audio und Mikrofon beim Aufnehmen.
Ist die App signiert und notariert?
Die FAQ sagt, das DMG aus GitHub Releases ist mit einem Developer-ID-Zertifikat signiert und von Apple notariert, sodass macOS Gatekeeper es ohne Warnungen öffnet.
Alternativen
- Kostenpflichtige Screenshot-/Annotationstools für macOS: Diese legen meist Wert auf polierte UX und bieten oft Cloud-Funktionen; Capso positioniert sich als kostenlose Open-Source-Alternative mit nativer Swift-Integration.
- Browserbasierte Screenshots und Screen-Recording: Nützlich für leichte Aufnahmen im Web-Workflow, trennen aber Capture, Annotation und Textextraktion in separate Schritte.
- Basis-macOS-Screenshot + integrierte Markup-Funktion: Geeignet für einfache Screenshots, bietet aber nicht denselben kombinierten Workflow für Aufnahmen (MP4/GIF), Webcam-PiP und OCR wie bei Capso beschrieben.
- Open-Source-Capture-/Annotation-Apps: Bei Vorliebe für Open-Source-Tools nach Projekten suchen, die Capture und Editing bündeln; Capso kombiniert speziell Annotation, Verschönerung, OCR und Recording in einer Oberfläche.
Alternativen
Tactiq
Tactiq ist ein KI-Meeting-Assistent, der Live-Transkription, KI-Zusammenfassungen, Aktionspunkte und benutzerdefinierte KI-Aufforderungen für Google Meet, Zoom und Teams bietet.
Tavus
Tavus entwickelt KI für Echtzeit-Gespräche von Mensch zu Mensch: sie sieht, hört und reagiert. Zudem Video-Agents, Digital Twins & AI Companions via APIs.
Nolain OCR
Nolain OCR ist eine fortschrittliche optische Zeichenerkennungslösung, die entwickelt wurde, um Text und Daten präzise aus verschiedenen Dokumentenformaten zu extrahieren und so Dokumentenverarbeitungsworkflows zu optimieren.
Scriptmine
Scriptmine macht echte Publikumsfragen und Trends aus Communities zu kamerafertigen Skripten für Creator – zum schneller Schreiben, Bearbeiten und Aufnehmen.
Scripta
Scripta ist ein KI-gestützter Notizassistent mit Fokus auf Datenschutz, der Ihre Besprechungen direkt auf Ihrem Gerät aufzeichnet, transkribiert und zusammenfasst, ohne dass ein Bot-Zugriff erforderlich ist.
DataSieve: Text to Data
DataSieve: Text to Data extrahiert E-Mails, Daten, URLs und mehr aus Text und vielen Dateitypen – komplett offline auf iPhone, iPad und Mac.