UStackUStack
doing icon

doing

Entrada de voz y captura de pantalla para creadores de IA en Mac, con transcripción local en el dispositivo. Sin subir a la nube ni cuenta. Descarga única $49.

doing

¿Qué es doing?

doing es una aplicación para Mac que permite entrada de voz y transcripción local y privada por diseño. Escucha al mantener pulsada una tecla rápida, transcribe tu voz en tiempo real y pega el texto resultante en la posición del cursor activo—para que puedas hablar en lugar de escribir mientras usas herramientas de IA y cualquier campo de texto.

El propósito principal es la transcripción en el dispositivo sin subida a la nube ni cuenta. El producto también permite adjuntar capturas de pantalla a una grabación, y ofrece procesamiento posterior configurable (“Skills”) antes de pegar la transcripción.

Características principales

  • Transcripción de voz con tecla rápida: Mantén pulsada una tecla rápida para empezar a escuchar, habla mientras el texto se transcribe en tiempo real; suelta para pegar en tu cursor.
  • Manejo local y privado del audio: Diseñado para que tu voz nunca salga de tu Mac—sin transcripción en la nube, sin cuenta ni audio subido.
  • Captura de pantalla adjunta a la transcripción: Mientras mantienes la tecla rápida, arrastra un rectángulo en cualquier lugar de la pantalla para capturar capturas que se vinculan a la misma sesión de transcripción.
  • Pegado a nivel de sistema en el cursor activo: Funciona en cualquier lugar donde puedas escribir (navegador, editor, terminal, etc.), pegando en la posición actual del cursor.
  • Modo YOLO para entrega rápida a prompts de IA: Al activarlo, doing pulsa Return después de pegar la transcripción para ejecutar tu prompt sin pasos extra.
  • Skills para procesamiento posterior de la transcripción: Define acciones que procesan la transcripción antes de pegarla (ejemplos incluyen formalizar, resumir, convertir a prompt de código o reemplazar texto por emoji), con comportamiento “consciente de la app” según donde pegues.
  • Opciones de motor con benchmarks: Incluye un motor en el dispositivo (Parakeet) y permite usar tus propias claves API para motores en la nube; incluye una herramienta de benchmark para probar proveedores con el mismo audio.
  • Reducción de audio durante la grabación: Reduce automáticamente la música/audio al iniciar la grabación y la restaura al detenerla.

Cómo usar doing

  1. Descarga e instala en Mac (macOS 14+ en Apple Silicon).
  2. En un campo de texto, mantén pulsada la tecla rápida configurada (mostrada como fn Talk) para empezar a escuchar.
  3. Habla mientras la transcripción se actualiza en tiempo real.
  4. Suelta la tecla rápida para pegar la transcripción en la posición de tu cursor.
  5. Opcionalmente captura capturas de pantalla arrastrando un rectángulo durante la grabación, y/o activa Modo YOLO para que doing pulse Return después de pegar.
  6. Si quieres un comportamiento de transcripción diferente, configura Skills y (donde aplique) selecciona el motor de transcripción—ya sea la opción integrada en el dispositivo o motores en la nube con tu propia clave API.

Casos de uso

  • Habla con un asistente de codificación IA desde tu editor: Usa transcripción de voz y pegado a nivel de sistema para que la transcripción llegue directamente al campo de entrada donde trabajas, luego pulsa Return (con Modo YOLO) para enviar.
  • Prepara mensajes estructurados para diferentes apps: Usa Skills conscientes de la app para reescribir o formatear tu transcripción en contextos como email (formalizar) o herramientas de productividad (resumir en viñetas).
  • Describe bugs con contexto visual: Mientras grabas tu voz, captura una o más capturas de pantalla para que los detalles visuales se adjunten a la sesión de transcripción.
  • Genera prompts orientados a código desde intención hablada: Usa un Skill de prompt de código para convertir una descripción hablada en una instrucción técnica adecuada para un asistente de codificación.
  • Ejecuta pruebas de transcripción lado a lado: Usa la herramienta de benchmark integrada para comparar el motor en el dispositivo contra otros motores disponibles con la misma muestra de audio, eligiendo según compensaciones de velocidad/costo.

Preguntas frecuentes

  • ¿doing sube mi audio a la nube? La página indica que doing transcribe localmente sin audio subido ni transcripción en la nube.

  • ¿Necesito una cuenta para usar doing? No se requiere cuenta, según la página.

  • ¿Qué es el Modo YOLO y qué cambia en el flujo de trabajo? El Modo YOLO pega la transcripción y luego pulsa Return automáticamente, para que el prompt de IA se ejecute de inmediato.

  • ¿Puede doing trabajar con capturas de pantalla y voz juntas? Sí. Mientras mantienes la tecla rápida, puedes arrastrar un rectángulo para capturar capturas que se adjuntan automáticamente a la transcripción.

  • ¿Puedo elegir diferentes motores de transcripción? La página indica que doing incluye un motor local (Parakeet) y permite usar claves API propias para motores en la nube; también incluye una herramienta de benchmark para probar motores con el mismo audio.

Alternativas

  • Escritura de voz en el dispositivo integrada en macOS (dictado del sistema): Ofrece transcripción de voz a texto para escritura general, pero no proporciona el mismo flujo de trabajo de transcripción con teclas rápidas hacia el cursor, adjunto de capturas de pantalla ni «Skills» de posprocesamiento descritos para doing.
  • Servicios/APIs de transcripción en la nube: Normalmente requieren subir audio y pueden implicar cuentas o costes por uso del proveedor; la propuesta de doing es local/sin subida de audio y motores opcionales con tu propia clave.
  • Otras herramientas de entrada de voz para IA con suscripción: La página compara el precio único de $49 de doing con otras herramientas que cobran $8–15 al mes; las alternativas pueden diferir en modelo de privacidad (nube vs local) y coste recurrente.
  • Extensiones de entrada de voz con teclas rápidas para navegador/editor: Pueden reducir la escritura en apps específicas, pero doing se presenta como a nivel de sistema para que funcione donde puedas escribir (no limitado a un sitio o editor único).