Gemini 3.5 Live Translate es el modelo de audio de Google para traducción de voz a voz casi en tiempo real en más de 70 idiomas, ideal para llamadas, reuniones y clases.
PodWalk: Guided Tours genera recorridos de audio guiados por ubicación para ciudades, pueblos, barrios y calles. Ideal para viajeros y locales, con reproducción sin manos y soporte multilingüe.
MAI-Voice-2 es el modelo de texto a voz de Microsoft AI para generar voz natural y expresiva a partir de texto. Admite 15 idiomas.
Voiser.ai es un generador de voz AI y voiceover que convierte texto en audio hablado, con voces y idiomas para narración y contenidos multilingües.
Our Stories es un producto multilingüe para familias: lee, escucha y comparte un mismo cuento en los idiomas que hablan, incluso a distancia.
Wallie es un framework de streaming con IA de código abierto para VTubers, con visión en tiempo real, chat, TTS y salida de avatar para Twitch, YouTube o Kick.
Podio: News Podcast Maker es una app de audio con IA que convierte temas y noticias en un podcast diario personalizado para escuchar sin manos en iPhone y iPad.
Reader Alive es un lector de ebooks con IA para iPhone y iPad que admite EPUB, PDF, MOBI y AZW3, con traducción, texto a voz y chat sobre el libro.
Selectable captura y extrae texto de cualquier parte de tu pantalla en macOS, incluidas imágenes y videos. Traduce (macOS 26+) y escucha con TTS.
FlowSpeech convierte guiones en audio TTS con emoción según el contexto y pausas precisas. Incluye 30+ voces y 70+ idiomas.
Gemini 3.1 Flash TTS de Google: modelo TTS que genera voz AI más natural y expresiva, con audio tags granulares y SynthID en 70+ idiomas.
Lightning TTS v3, la API de texto a voz de Smallest.ai con baja latencia y multilingüe, incluye clonación de voz. Gana $10 en créditos.
Claude Voice Mode en beta te permite hablar con Claude y escuchar sus respuestas por voz. Cambia entre voz y texto en la misma conversación.
Lee el Corán en línea gratis con recitación por audio y traducciones, con análisis palabra por palabra en 18 idiomas. easyquran.ai
Voxtral TTS es el modelo multilingüe de Mistral AI para convertir texto en voz natural y de baja latencia, con voces adaptables para agentes.
Clipchamp AI Voice Over Generator es una herramienta online de texto a voz (TTS) para convertir guiones en locuciones realistas para videos.
LOVO es un generador de voz con IA y TTS que crea locuciones realistas en 100+ idiomas, con editor de video online para sincronizar y subtítulos.
TADA (Text-Acoustic Dual Alignment) es el modelo de texto a voz open-source de Hume AI que sincroniza texto y audio uno a uno para una locución rápida y fiable.
Ondoku es un software TTS: pega texto, elige idioma y voz, escúchalo en la web y descárgalo como .mp3.
Xeder es una extensión de Chrome que lee tu feed de X (Twitter) en voz alta, para escuchar actualizaciones mientras haces otras cosas.