HypeScribe: Transcripción IA precisa de audio/vídeo. Resúmenes inteligentes, insights y colaboración en una app. ¡Prueba gratis!
La API en Tiempo Real de OpenAI facilita la comunicación multimodal de baja latencia para construir aplicaciones como agentes de voz, soportando voz-a-voz, entradas de audio/imagen/texto, y salidas de audio/texto.
Zavi AI es un teclado avanzado de mecanografía por voz que transforma el habla natural en texto limpio y profesional al instante, eliminando automáticamente palabras de relleno y corrigiendo la gramática en todas las aplicaciones.
Dictato es una aplicación de dictado privada y en el dispositivo para Mac que convierte la voz en texto instantáneamente en todas las aplicaciones utilizando los motores Whisper, Parakeet o Apple.
Thinklet es una aplicación de toma de notas impulsada por IA y centrada en la voz que transcribe instantáneamente los pensamientos hablados en notas organizadas y permite a los usuarios chatear con su base de conocimientos localmente en el dispositivo.
Willow Voice es un software de dictado de voz a texto con IA inteligente y consciente del contexto, disponible para Mac, Windows y iOS, diseñado para aumentar la productividad convirtiendo el habla natural en texto perfecto al instante.
闪电说 AI 语音输入法 es una herramienta de entrada de voz con IA priorizando el procesamiento local, que afirma ser hasta 4 veces más rápida que la escritura tradicional, ofreciendo respuesta en milisegundos y potentes funciones de autocorrección inteligente con IA, compatible con todas las aplicaciones.
ClawdTalk cierra la brecha entre los bots basados en texto (como los creados con OpenClaw) y la comunicación de voz del mundo real, permitiendo a los usuarios llamar a sus bots como si fuera una llamada telefónica.
Una herramienta en línea gratuita que convierte archivos de audio y video en transcripciones de texto precisas en más de 45 idiomas. Admite numerosos formatos de archivo y no requiere descargas ni registros.
MiniCPM-o 4.5 es un modelo de IA multimodal altamente capaz, diseñado para visión, habla y transmisión en vivo de dúplex completo, ofreciendo comprensión visual avanzada, síntesis de voz y capacidades interactivas en tiempo real en una arquitectura compacta de 9 mil millones de parámetros.
Voxtral es una plataforma avanzada de reconocimiento de voz a texto que ofrece transcripción en tiempo real y por lotes con diarización, soporte multilingüe y baja latencia, adecuada para uso empresarial y de desarrolladores.

Tu IA personal que recuerda todo lo que ves, dices y oyes. Gratuita, de código abierto, 100% local.

Voice Anywhere es una herramienta de dictado instantáneo para macOS que convierte tu voz en texto en cualquier aplicación al instante.
Sayline es la forma más productiva de escribir, permitiendo a los usuarios dictar texto de manera rápida y eficiente con una potente tecnología de dictado por IA.
TalkMirror es una herramienta profesional de retroalimentación de voz diseñada para estudiantes de idiomas, oradores públicos y actores, que proporciona autocorrección instantánea a través de la reflexión de voz.
Qlay ofrece supervisión de proctoring impulsada por IA para procesos de evaluación transparentes.

Convierte el habla a texto sin esfuerzo con la extensión de Chrome de BlabbyAI.
Poised es un entrenador de comunicación impulsado por IA que proporciona retroalimentación en tiempo real para ayudarte a hablar con confianza durante las llamadas.
Servicio de transcripción impulsado por IA que convierte archivos de audio y video en texto.
AIMIX智剪 es un software de edición de video inteligente que permite la producción rápida por lotes de videos cortos originales, aprovechando la IA para funciones como la generación automática de subtítulos y la síntesis de voz.