Gemini 3.5 Live Translate ist Googles Audiomodell für nahtlose Sprach-zu-Sprach-Übersetzung in über 70 Sprachen – für Anrufe, Meetings, Unterricht und Live-Übertragungen.
PodWalk: Guided Tours erstellt ortsbasierte Audio-Walking-Touren für Städte, Orte, Viertel und Straßen – mit Offline-Wiedergabe und mehrsprachiger Unterstützung.
MAI-Voice-2 ist Microsoft AI’s Text-to-Speech-Modell für natürliche, ausdrucksstarke Sprache aus Text. Unterstützt 15 Sprachen.
Voiser.ai ist ein KI-Text-zu-Sprache- und Voiceover-Generator für natürlich klingende Sprecher in über 140 Sprachen.
Our Stories ist ein mehrsprachiges Story-Sharing-Produkt für Familien. Eine Geschichte lesen, hören und mit Angehörigen teilen – auch über Distanz.
Wallie ist ein Open-Source-AI-Streamer-Framework mit Echtzeit-Vision, anpassbaren Persönlichkeiten, Chat, TTS und Avatar-Ausgabe für VTuber-Streams auf Twitch, YouTube oder Kick.
Podio: News Podcast Maker ist eine KI-Audio-App für personalisierte tägliche Podcast-Streams mit News, Digests und Themenfolgen – hands-free auf iPhone und iPad.
Reader Alive ist ein KI-Ebook-Reader für iPhone und iPad, der EPUB-, PDF-, MOBI- und AZW3-Dateien unterstützt und Übersetzung, Sprachausgabe, Kapitelzusammenfassungen und Chat bietet.
Selectable erfasst und extrahiert Text von jedem Bereich auf deinem Mac-Bildschirm – auch aus Bildern & Videos. Sofort übersetzen, TTS hören, Daten maskieren.
FlowSpeech ist ein KI-Text-to-Speech-Tool, das Skripte in menschenähnlichen Audio-Output mit kontextbezogener Emotion und präziser Pausensteuerung umwandelt.
Gemini 3.1 Flash TTS ist Googles Text-to-Speech-Modell für natürlichere, ausdrucksstärkere KI-Sprachausgabe in 70+ Sprachen mit SynthID-Wasserzeichen.
Lightning TTS v3 von Smallest.ai: Text-to-Speech API für Low-Latency, mehrsprachige Sprache & Voice-Cloning für Voice Agents. 10$ Gratis-Credits.
Mit Claude Voice Mode sprich mit Claude und höre die Antworten per Stimme. Wechsel zwischen Voice und Text im selben Chat möglich.
Lies den Koran online kostenlos mit Audio-Rezitation und Übersetzungen, inkl. Wort-für-Wort-Analyse in 18 Sprachen – für alle 114 Suren.
Voxtral TTS von Mistral AI: mehrsprachiges Text-to-Speech-Modell für natürliche, sprachagententaugliche Ausgabe mit geringer Latenz und anpassbaren Sprecherstimmen.
Clipchamp AI Voice Over Generator: Online Text-zu-Sprache zur Erstellung realistischer Sprecher für Videos—ohne App-Download, mit Mehrsprachen, Tempo & Emotion.
LOVO ist ein KI-Voice-Generator und Text-to-Speech-Tool: realistische Voiceovers in 100+ Sprachen, plus Online-Videoeditor für Sync und Untertitel.
TADA (Text-Acoustic Dual Alignment) von Hume AI: Open-Source-Text-to-Speech-Modell mit 1:1 Synchronisierung von Text und Audio für schnelle, zuverlässige Sprache.
Ondoku ist eine TTS-Software: Text einfügen, mit gewählter Stimme vorlesen lassen und als .mp3 herunterladen. Mit Mehrsprach- und Voice-Optionen.
Xeder ist eine Chrome-Erweiterung, die deinen X (Twitter)-Feed vorliest – so kannst du Updates hören, während du nebenbei arbeitest.