Gemini 3.5 Live Translate est le modèle audio de Google pour la traduction vocale quasi instantanée dans 70+ langues, pour appels, réunions et cours.
PodWalk: Guided Tours crée des audioguides de marche géolocalisés pour villes, quartiers et rues, avec écoute mains libres, hors ligne et en plusieurs langues.
MAI-Voice-2 de Microsoft AI est un modèle de synthèse vocale pour créer une voix naturelle et expressive à partir de texte, avec 15 langues et contrôle des émotions.
Voiser.ai est un générateur de voix off et de synthèse vocale IA qui transforme vos textes en audio. Large choix de voix et de langues.
Our Stories : histoires multilingues pour familles, à lire, écouter et partager dans la langue de chacun, même à distance.
Wallie est un framework open-source d’AI streamer pour VTuber, avec vision en temps réel, chat, TTS et avatar pour Twitch, YouTube ou Kick.
Podio : News Podcast Maker est une application audio IA qui transforme vos sujets et centres d’intérêt en podcast quotidien personnalisé sur iPhone et iPad.
Reader Alive est un lecteur d’ebooks IA pour iPhone et iPad, compatible EPUB, PDF, MOBI et AZW3, avec traduction, synthèse vocale et résumés.
Selectable capture et extrait du texte sur l’écran (images, vidéos), le traduit instantanément sur macOS 26+, lit à voix haute et masque les données sensibles.
FlowSpeech convertit vos scripts en audio TTS naturel : contrôle fin des émotions et des pauses, 30+ voix, 70+ langues.
Gemini 3.1 Flash TTS de Google : modèle TTS générant une voix IA plus naturelle et expressive, avec audio tags fins et SynthID pour 70+ langues.
Lightning TTS v3, l’API TTS de Smallest.ai : faible latence, parole multilingue et clonage vocal pour agents vocaux et audio de production. 10$ offerts.
Claude Voice Mode (bêta) permet de parler à Claude et d’écouter ses réponses vocales. Basculez aussi entre voix et texte dans la même conversation.
Lisez le Coran en ligne gratuitement avec récitation audio et traductions, dont une analyse mot à mot en 18 langues, sur easyquran.ai.
Voxtral TTS, modèle TTS multilingue de Mistral AI, pour une génération vocale naturelle à faible latence et voix adaptables en workflows d’agents.
Clipchamp AI Voice Over Generator : outil en ligne texte-voix pour créer une voix off réaliste pour vos vidéos. Sans application, multilingue, vitesse et émotion.
LOVO est un générateur de voix IA et un outil TTS : doublez vos vidéos avec des voix réalistes en 100+ langues et éditez en ligne.
TADA (Text-Acoustic Dual Alignment) est le modèle open-source de Hume AI pour la synthèse vocale : synchronisation texte-audio un-à-un pour un TTS rapide.
Ondoku est un outil TTS : collez votre texte, choisissez la langue et la voix, écoutez et téléchargez l’audio en .mp3.
Xeder est une extension Chrome qui lit votre fil X (Twitter) à voix haute, pour écouter les mises à jour pendant que vous faites autre chose.