speech-core est un moteur C++17 de pipeline voix sur appareil pour VAD, transcription speech-to-text en flux ou par lots, diarisation et text-to-speech.
Voiser.ai est un générateur de voix off et de synthèse vocale IA qui transforme vos textes en audio. Large choix de voix et de langues.
Podio : News Podcast Maker est une application audio IA qui transforme vos sujets et centres d’intérêt en podcast quotidien personnalisé sur iPhone et iPad.
Tico est un assistant IA pour Windows : il écoute vos questions à la voix, comprend ce que vous voyez à l’écran et guide où cliquer.
Yeta AI traduit et double des vidéos YouTube en temps réel avec des voix IA dans 10+ langues. Essai gratuit : 15 min/mois, sans carte.
Morph combine ebooks et audiobooks avec une lecture synchronisée : lisez, écoutez ou les deux, et utilisez un assistant IA pour les questions.
FlowSpeech convertit vos scripts en audio TTS naturel : contrôle fin des émotions et des pauses, 30+ voix, 70+ langues.
APIs Grok Speech to Text et Text to Speech d’xAI : conversion audio/texte à faible latence via REST/WebSocket, support multilingue et diarisation.
Gemini 3.1 Flash TTS de Google : modèle TTS générant une voix IA plus naturelle et expressive, avec audio tags fins et SynthID pour 70+ langues.
Contrôles de sécurité et de comportement configurables pour ElevenAgents : guident les réponses vocales de l’IA et bloquent les sorties dangereuses ou hors politique.
HeyGen développeurs : plateforme API pour générer, traduire et faire du lipsync de vidéos avec avatars et modèles TTS, pensée pour des workflows à grande échelle.
Lightning TTS v3, l’API TTS de Smallest.ai : faible latence, parole multilingue et clonage vocal pour agents vocaux et audio de production. 10$ offerts.
Voxtral TTS, modèle TTS multilingue de Mistral AI, pour une génération vocale naturelle à faible latence et voix adaptables en workflows d’agents.
Gemini 3.1 Flash Live : modèle audio et voix temps réel de Google pour des interactions vocales plus naturelles et fiables sur vos produits.
Transformez n’importe quel article en épisode audio : collez un lien pour écouter dans votre app podcast ou abonnez-vous à un flux quotidien.
Voizematic, logiciel d’agent vocal IA pour automatiser les appels entrants et sortants, la réservation Google Calendar et des relances en 25+ langues.
Clipchamp AI Voice Over Generator : outil en ligne texte-voix pour créer une voix off réaliste pour vos vidéos. Sans application, multilingue, vitesse et émotion.
Maestra est une plateforme de traduction média par IA qui génère des transcriptions, sous-titres et voiceovers multilingues, dont traduction temps réel et live captions.
Inworld AI propose des API temps réel de text-to-speech, speech-to-text et speech-to-speech, ainsi qu’un Router multi-modèles avec basculement.
Fliki crée des vidéos IA et des voice-overs à partir de texte, idées, PPT, blogs ou URLs produit, en 80+ langues. Démarrez gratuitement, sans carte.