Signal Recorder SR-7 ist eine Sprachaufnahme-App für Mac und iPhone, die Audio lokal transkribiert, Titel und Zusammenfassungen erstellt und Aufnahmen als Markdown exportiert.
speech-core ist eine C++17 On-Device-Voice-Agent-Pipeline-Engine für VAD, Streaming- und Batch-Spracherkennung, Diarisierung und Text-to-Speech ohne Cloud-Inferenz.
Krisp Voice Translation API ist eine Echtzeit-Speech-to-Speech-API für Live-Anrufe und Sprachanwendungen. Übersetzt in 61 Sprachen mit any-to-any-Pairing.
Vox ist eine On-Device-AI-Diktier-App für Mac und Windows, die gesprochene Eingaben als bereinigten Text in die Zwischenablage überträgt.
Wave ist eine native macOS-Diktier-App, die Sprache direkt am Cursor in Text umwandelt – mit lokalem Whisper offline oder Groq für schnellere Transkription.
Daisy ist eine quelloffene, lokal-first Meeting-Recorder- und Diktier-App für Mac. Sie zeichnet Audio lokal auf, transkribiert offline und speichert Protokolle als Markdown.
LocalClicky ist ein lokaler macOS-Sprachassistent für freihändige Steuerung, der Sprache offline transkribiert, Befehle versteht und den Mac bedient.
Sun ist eine Realtime Voice API für kollaborative Sprachinteraktionen in Apps und Produkten – für Entwickler, die Live-Voice-Erlebnisse jenseits von 1:1-Chat brauchen.
Ringg Parrot STT V1 ist eine Speech-to-Text API für Echtzeit- und Datei-Transkription von Hindi, Englisch und Code-Mixed Speech mit Python-Integration.
TongueType ist eine macOS-Diktier-App, die Sprache lokal mit Whisper AI transkribiert und Text an der Cursorposition einfügt – ohne Cloud, Konto oder Abo.
Carbon Voice ist eine asynchrone Voice-Messaging-App für Teams, die Menschen und KI-Agenten an einem Ort vereint. Nachrichten auf Desktop, Mobilgerät und Watch.
Tico ist ein KI-Assistent für Windows: hört Ihre Sprachfragen, versteht, was auf dem Bildschirm ist, gibt Anleitung per Sprache und zeigt, wo Sie klicken.
Snaply zeichnet Meetings auf dem Mac auf und erstellt nach dem Call Transkript, saubere Zusammenfassung und Action Items – lokal für mehr Privatsphäre.
Memoket Gem ist ein tragbares Aufnahmegerät, das Gespräche mitschneidet und per „Press once“ in nutzbaren Kontext für AI-Tools verwandelt.
Erstelle Voice Agents mit der AssemblyAI Voice Agent API: Audio streamen und Sprach-Output zurück erhalten. Transkripte u. a. mit Audio-Tags, Rollen & Code-Switching.
Ora ist ein persönlicher, On-Device-Simultan-Dolmetscher für macOS: Echtzeit-Übersetzung mit Streaming-Teilausgaben, ohne Audio-Upload. Kostenlos.
SpeakMac ist eine Offline-Diktier-App für Mac: Live-Spracherkennung im aktiven Fenster per On-Device-Verarbeitung, unterstützt 25+ Sprachen, Kauf ohne Abo.
SpeakON ist ein iPhone-Sprachdiktiergerät: mit einer Taste drücken, sprechen und polierten Text direkt in die App senden.
Harker ist eine kostenlose Voice-to-Text-App für macOS: Diktieren Sie per globalem Shortcut überall im Textfeld – mit Premium für AI-Stile, Format & Übersetzung.
xAI Grok Speech to Text (STT) und Text to Speech (TTS) APIs für Audio- und Text-Umwandlung mit Low-Latency REST/WebSocket, multilingual inkl. Sprecher-Diarisierung.