speech-core es un motor C++17 local para voz: VAD, STT por streaming y por lotes, diarización y TTS en Linux, Windows, Android y Apple, sin nube.
Voiser.ai es un generador de voz AI y voiceover que convierte texto en audio hablado, con voces y idiomas para narración y contenidos multilingües.
Podio: News Podcast Maker es una app de audio con IA que convierte temas y noticias en un podcast diario personalizado para escuchar sin manos en iPhone y iPad.
Tico es un asistente de IA para Windows: escucha tus preguntas por voz, entiende lo que ves en pantalla y guía dónde hacer clic.
Yeta AI traduce y dobla videos públicos de YouTube en tiempo real con voces de IA en 10+ idiomas. Empieza gratis: 15 min/mes, sin tarjeta.
Morph combina ebooks y audiolibros en una experiencia de lectura sincronizada: lee, escucha o ambos a la vez. Incluye asistente AI para preguntas.
FlowSpeech convierte guiones en audio TTS con emoción según el contexto y pausas precisas. Incluye 30+ voces y 70+ idiomas.
xAI ofrece APIs Grok Speech to Text y Text to Speech con endpoints REST/WebSocket de baja latencia, soporte multilingüe y funciones como diarización.
Gemini 3.1 Flash TTS de Google: modelo TTS que genera voz AI más natural y expresiva, con audio tags granulares y SynthID en 70+ idiomas.
Controles de seguridad y comportamiento configurables para ElevenAgents: guía respuestas de voz y bloquea salidas inseguras o fuera de política antes de llegar al usuario.
HeyGen API para generar, traducir y hacer lipsync en video con avatares y modelos TTS. Diseñada para flujos de producción a escala.
Lightning TTS v3, la API de texto a voz de Smallest.ai con baja latencia y multilingüe, incluye clonación de voz. Gana $10 en créditos.
Voxtral TTS es el modelo multilingüe de Mistral AI para convertir texto en voz natural y de baja latencia, con voces adaptables para agentes.
Gemini 3.1 Flash Live, modelo de audio y voz en tiempo real de Google para interacciones más naturales y fiables en Google y APIs de desarrolladores.
Convierte cualquier artículo en un episodio de podcast. Pega un enlace para escucharlo en tu app o suscríbete a un feed diario por temas.
Voizematic es software de agente de voz con IA para automatizar llamadas entrantes y salientes, reservar en Google Calendar y hacer seguimientos en 25+ idiomas.
Clipchamp AI Voice Over Generator es una herramienta online de texto a voz (TTS) para convertir guiones en locuciones realistas para videos.
Maestra es una plataforma de traducción de medios con IA que genera transcripciones, subtítulos y locuciones multilingües en tiempo real.
Inworld AI ofrece APIs en tiempo real de text-to-speech, speech-to-text y speech-to-speech, además de Router con selección y failover entre LLMs.
Fliki crea videos de IA y locuciones a partir de texto, ideas, PPT, blogs o URLs de producto, con soporte multilingüe y avatares. Empieza gratis.