Signal Recorder SR-7 es una app de grabadora de voz para Mac y iPhone que transcribe audio en el dispositivo, crea títulos y resúmenes locales y exporta grabaciones como archivos Markdown.
speech-core es un motor C++17 local para voz: VAD, STT por streaming y por lotes, diarización y TTS en Linux, Windows, Android y Apple, sin nube.
Krisp Voice Translation API es una API de traducción de voz a voz en tiempo real para llamadas en directo y aplicaciones de voz. Traduce en 61 idiomas.
Vox es una app de dictado con IA para Mac y Windows que convierte tu voz en texto limpio en el portapapeles, sin cuenta y con uso offline.
Wave es una app nativa de dictado para macOS que convierte voz en texto en el cursor, con Whisper local para privacidad offline o Groq para mayor rapidez.
Daisy es un grabador de reuniones y app de dictado de código abierto para Mac, local y privado. Transcribe en el dispositivo y guarda en markdown.
LocalClicky es un asistente de voz para macOS que funciona en local, transcribe voz, interpreta comandos, analiza la pantalla y controla el Mac sin enviar datos a la nube.
Sun es una API de voz en tiempo real para interacción colaborativa en apps y productos. Ideal para desarrolladores que necesitan experiencias de voz en vivo más allá del chat 1:1.
Ringg Parrot STT V1 es una API de speech-to-text para transcripción en tiempo real y desde archivos de hindi, inglés y habla mixta, con integración Python.
TongueType es una app de dictado por voz para macOS que transcribe localmente con Whisper AI e inserta texto donde esté el cursor, sin nube ni suscripciones.
Carbon Voice es una app de mensajes de voz asíncronos para equipos que reúne personas y agentes de IA. Envía actualizaciones con transcripción y responde por voz o texto desde escritorio, móvil, reloj y widgets.
Tico es un asistente de IA para Windows: escucha tus preguntas por voz, entiende lo que ves en pantalla y guía dónde hacer clic.
Snaply graba reuniones en tu Mac y genera transcripción completa, resumen limpio y acciones, procesado localmente para privacidad. Notas editables.
Memoket Gem es un dispositivo wearable que registra conversaciones y las convierte en contexto para usar con herramientas de IA con captura “pulsa una vez”.
Crea agentes de voz con AssemblyAI Voice Agent API: transmite audio y recibe salida de voz en tiempo real. Configura transcripciones y etiquetas.
Ora es un intérprete simultáneo personal en tu Mac (en el dispositivo) para traducir voz en tiempo real, con subtítulos parciales. Gratis.
SpeakMac es una app de dictado voz a texto para Mac: transcribe sin conexión en tu ventana activa con procesamiento en el dispositivo y 25+ idiomas.
SpeakON es un dispositivo de dictado por voz para iPhone: presiona un botón, habla y consigue texto pulido en la app donde escribes.
Harker es una app gratis de voz a texto para macOS: dicta en cualquier app con un atajo global. Premium añade estilos de escritura con IA, formato, gramática y traducción.
xAI ofrece APIs Grok Speech to Text y Text to Speech con endpoints REST/WebSocket de baja latencia, soporte multilingüe y funciones como diarización.