UStackUStack
Cai icon

Cai

Cai ist eine kostenlose, Open-Source-„AI action layer“ für macOS: Text oder Bild markieren, ⌥C drücken und Inline-Aktionen wie Prompts, OCR, Skripte & mehr ausführen.

Cai

Was ist Cai?

Cai ist eine kostenlose, Open-Source-„AI action layer“ für macOS, die Aktionen direkt auf der Auswahl in jeder App ausführt. Die Kernidee: App-Wechsel vermeiden – Text oder Bild markieren, einen Shortcut drücken und aus Inline-Aktionen wie Prompts, Skripten, OCR oder Issue-Erstellung wählen.

Es kommt mit integriertem lokalen KI-Modell (inkl. Ministral 3B via MLX) und ist für lokale Verarbeitung per Default ausgelegt. Es kann auch lokale Model-Server und optionale Cloud-Provider verbinden, je nach gewähltem Modell.

Wichtige Funktionen

  • Auswahlbasierte Aktionen (nicht nur Clipboard): Cai wirkt auf markierten Text oder ausgewähltes Bild, statt nur Clipboard-Historie zu speichern oder zu durchsuchen.
  • Inline-Shortcut-Workflow: ⌥C drücken, um Aktionsliste zu öffnen, dann Aktion wählen – für kontextbezogene Ergebnisse am Arbeitsort.
  • Intelligente Aktionen für Text und Bilder: Unterstützt Aktionen wie AI-Prompts, Terminal-Skripte, Zusammenfassungen, Übersetzungen, Grammatik-Korrektur, OCR (Bild zu Text) und mehr.
  • Entwickler-Features integriert: GitHub-Issues und Linear-Tickets aus Auswahl erstellen; unterstützt auch terminal-ähnliche Skripte als Aktionen.
  • Local-First-Modell-Support: Mit integriertem lokalem Modell, offline-fähig auf Gerät; Cloud optional.
  • Eigene Aktionsbibliothek: Eigene Aktionen mit Prompts, Shell-Skripten und URL-basierten Aktionen bauen, als Ein-Tasten-Aktionen speichern.

So nutzt du Cai

  1. Cai installieren via Homebrew (die Seite gibt Tap + Cask-Install-Befehl).
  2. In jeder App Text auswählen (oder Bild/Screenshot mit Text).
  3. ⌥C drücken, um Cai-Aktionsliste zu öffnen.
  4. Aktion wählen (z. B. zusammenfassen, übersetzen, OCR-zu-Text-Flow oder GitHub/Linear-Item erstellen). Eigene Aktionen erscheinen neben den integrierten.

Anwendungsfälle

  • Fehler oder Nachricht zusammenfassen, ohne App zu wechseln: Terminal-Fehlermeldung oder Chat-Text markieren, ⌥C drücken und Aktion für Zusammenfassung oder Fix-Vorschläge starten.
  • Screenshot per OCR auswerten und auf Text reagieren: Screenshot mit Text auswählen, Bild zu Text (OCR) ausführen, Ergebnis in weitere Aktion leiten (z. B. übersetzen, zusammenfassen oder Issue erstellen).
  • Auswahl zu Engineering-Ticket machen: Relevante Anforderungen, Logs oder Kontext in Dokument oder E-Mail markieren, dann Linear-Ticket (oder GitHub-Issue) direkt erstellen.
  • Terminal-Befehl aus markiertem Code ausführen: Cai-Shell-Funktion für parametrisierte Befehle nutzen (Beispiel mit markiertem Text), z. B. Pull-Requests suchen oder Git-Befehle bauen.
  • Wiederverwendbare Ein-Tasten-Prompts erstellen: Custom-Prompt-Vorlage oder URL-Suchaktion speichern, für wiederholten Workflow mit einem Shortcut auf zukünftigen Auswahlen.

FAQ

  • Ist Cai wirklich kostenlos?
    Ja. Cai ist kostenlos und Open Source, ohne Abonnement oder Account für die App selbst.

  • Brauche ich einen API-Key oder Account?
    Nein für die Standard-Lokal-Setup. Bei Cloud-Modell-Provider ist der API-Key des Providers nötig.

  • Funktioniert Cai offline?
    Integrierte Modelle und lokale LLM-Provider laufen on-device, alles ohne Internet; Cloud-Provider brauchen Internet.

  • Worauf unterscheidet sich Cai von Clipboard-Managern?
    Cai ist auswahlbasiert: Es führt Aktionen auf Markiertem aus, statt Clipboard-Historie zu speichern und abzurufen.

  • Worauf unterscheidet es sich von Chat-Apps mit App-Wechsel?
    Cai läuft inline auf markiertem Text mit einheitlichem Shortcut-Workflow, ohne Wechsel zu separater AI-Chat-App.

Alternativen

  • Clipboard-Manager (Text-Historie-Tools): Helfen, Clipboard-Inhalte zu suchen und zu wiederverwenden, führen aber keine AI oder Skripte primär auf aktueller Auswahl aus.
  • AI-Chat-Apps mit Copy/Paste-Workflow: Können Zusammenfassungen, Übersetzungen und Antworten erzeugen, erfordern aber meist App-Wechsel und manuelles Text-Verschieben.
  • Tastaturbasierte Produktivitäts-Tools (Launcher/Automatisierungs-Utilities): Führen Skripte oder Befehle per Hotkey aus, sind aber nicht auf auswahlbasierte AI-Aktionen mit integriertem OCR und Inline-Routing zugeschnitten.
  • Lokale LLM-UIs (Modelle on-device): Bieten offline AI, erfordern aber oft Text einfügen und manuelle Prompt-Verwaltung statt auswahlgetriebener Aktionen und Integrationen wie Issue/Ticket-Erstellung.
Cai | UStack