Gemini 3.5 Live Translate es el modelo de audio de Google para traducción de voz a voz casi en tiempo real en más de 70 idiomas, ideal para llamadas, reuniones y clases.
speech-core es un motor C++17 local para voz: VAD, STT por streaming y por lotes, diarización y TTS en Linux, Windows, Android y Apple, sin nube.
Krisp Voice Translation API es una API de traducción de voz a voz en tiempo real para llamadas en directo y aplicaciones de voz. Traduce en 61 idiomas.
Vox es una app de dictado con IA para Mac y Windows que convierte tu voz en texto limpio en el portapapeles, sin cuenta y con uso offline.
Wave es una app nativa de dictado para macOS que convierte voz en texto en el cursor, con Whisper local para privacidad offline o Groq para mayor rapidez.
LocalClicky es un asistente de voz para macOS que funciona en local, transcribe voz, interpreta comandos, analiza la pantalla y controla el Mac sin enviar datos a la nube.
Clarafy es un asistente de escritura para navegador que pule textos al instante, con reescrituras, ajuste de tono y dictado por voz.
Shadow es una app para Mac que captura lo que ves, oyes y dices, y ejecuta Skills personalizados sobre ese contexto. Convierte reuniones, voz y pantalla en notas, respuestas y resúmenes.
AutoSubtitles es un generador de subtítulos con AI y editor de captions en el navegador para crear, estilizar y exportar subtítulos sin instalar software.
Trace es una app de transcripción de reuniones para macOS que graba el micrófono y el audio del sistema de forma local, y genera un transcript en Markdown con momentos clave y marcas de tiempo.
Ringg Parrot STT V1 es una API de speech-to-text para transcripción en tiempo real y desde archivos de hindi, inglés y habla mixta, con integración Python.
TongueType es una app de dictado por voz para macOS que transcribe localmente con Whisper AI e inserta texto donde esté el cursor, sin nube ni suscripciones.
Carbon Voice es una app de mensajes de voz asíncronos para equipos que reúne personas y agentes de IA. Envía actualizaciones con transcripción y responde por voz o texto desde escritorio, móvil, reloj y widgets.
SpeakMac es una app de dictado voz a texto para Mac: transcribe sin conexión en tu ventana activa con procesamiento en el dispositivo y 25+ idiomas.
SpeakON es un dispositivo de dictado por voz para iPhone: presiona un botón, habla y consigue texto pulido en la app donde escribes.
Harker es una app gratis de voz a texto para macOS: dicta en cualquier app con un atajo global. Premium añade estilos de escritura con IA, formato, gramática y traducción.
xAI ofrece APIs Grok Speech to Text y Text to Speech con endpoints REST/WebSocket de baja latencia, soporte multilingüe y funciones como diarización.
Ghost Pepper es una app de dictado por voz y transcripción de reuniones para macOS: convierte voz a texto 100% local en Apple Silicon.
Entrada de voz y captura de pantalla para creadores de IA en Mac, con transcripción local en el dispositivo. Sin subir a la nube ni cuenta. Descarga única $49.
Walkie es una app de dictado por voz para escritorio: inserta texto en cualquier app con un atajo. Modo Fast en la nube o Local sin conexión.