APIs Grok Speech to Text et Text to Speech d’xAI : conversion audio/texte à faible latence via REST/WebSocket, support multilingue et diarisation.
Gemini 3.1 Flash TTS de Google : modèle TTS générant une voix IA plus naturelle et expressive, avec audio tags fins et SynthID pour 70+ langues.
Contrôles de sécurité et de comportement configurables pour ElevenAgents : guident les réponses vocales de l’IA et bloquent les sorties dangereuses ou hors politique.
HeyGen développeurs : plateforme API pour générer, traduire et faire du lipsync de vidéos avec avatars et modèles TTS, pensée pour des workflows à grande échelle.
Lightning TTS v3, l’API TTS de Smallest.ai : faible latence, parole multilingue et clonage vocal pour agents vocaux et audio de production. 10$ offerts.
Voxtral TTS, modèle TTS multilingue de Mistral AI, pour une génération vocale naturelle à faible latence et voix adaptables en workflows d’agents.
Gemini 3.1 Flash Live : modèle audio et voix temps réel de Google pour des interactions vocales plus naturelles et fiables sur vos produits.
Transformez n’importe quel article en épisode audio : collez un lien pour écouter dans votre app podcast ou abonnez-vous à un flux quotidien.
Voizematic, logiciel d’agent vocal IA pour automatiser les appels entrants et sortants, la réservation Google Calendar et des relances en 25+ langues.
Clipchamp AI Voice Over Generator : outil en ligne texte-voix pour créer une voix off réaliste pour vos vidéos. Sans application, multilingue, vitesse et émotion.
Maestra est une plateforme de traduction média par IA qui génère des transcriptions, sous-titres et voiceovers multilingues, dont traduction temps réel et live captions.
Inworld AI propose des API temps réel de text-to-speech, speech-to-text et speech-to-speech, ainsi qu’un Router multi-modèles avec basculement.
Fliki crée des vidéos IA et des voice-overs à partir de texte, idées, PPT, blogs ou URLs produit, en 80+ langues. Démarrez gratuitement, sans carte.
WikiTrip : guide audio de voyage basé sur la localisation pour iPhone. Lit des articles Wikipédia à proximité en voix IA, mains libres.
Synthesys.io : suite IA pour créer des vidéos d’avatars réalistes avec voix off, doublage en plusieurs langues et images assorties pour le contenu.
Transformez un seul live en diffusion multilingue avec un doublage audio IA en temps réel pour YouTube, Twitch, X et plus.
LOVO est un générateur de voix IA et un outil TTS : doublez vos vidéos avec des voix réalistes en 100+ langues et éditez en ligne.
Herodot AI : des audioguides et visites autoguidées alimentés par l’IA, avec narration par photos et navigation cartographique sur votre téléphone.
TADA (Text-Acoustic Dual Alignment) est le modèle open-source de Hume AI pour la synthèse vocale : synchronisation texte-audio un-à-un pour un TTS rapide.
Ondoku est un outil TTS : collez votre texte, choisissez la langue et la voix, écoutez et téléchargez l’audio en .mp3.