UStackUStack
doing icon

doing

Trascrizione vocale e input da screenshot per AI su Mac: niente upload su cloud, niente account. Download una tantum da $49.

doing

Cos'è doing?

doing è un'applicazione per Mac per input vocale e trascrizione che funziona localmente e con privacy integrata. Ascolta quando tieni premuto un tasto di scelta rapida, trascrive il tuo discorso in tempo reale e incolla il testo risultante nella posizione del cursore attivo—così puoi parlare invece di digitare mentre usi tool AI e qualsiasi campo di testo.

Lo scopo principale è la trascrizione on-device senza upload su cloud e senza account. Il prodotto supporta anche l'attachment di screenshot a una registrazione e offre post-elaborazione configurabile (“Skills”) prima che la trascrizione venga incollata.

Caratteristiche Principali

  • Trascrizione vocale con tasto di scelta rapida tenuto premuto: Inizia l'ascolto tenendo premuto un tasto di scelta rapida, parla mentre il testo viene trascritto in tempo reale; rilascia per incollare al cursore.
  • Gestione audio locale e privata: Progettata così che la tua voce non lasci mai il tuo Mac—niente trascrizione cloud, niente account e niente audio caricato.
  • Cattura screenshot allegata alla trascrizione: Mentre tieni premuto il tasto di scelta rapida, trascina un rettangolo ovunque sullo schermo per catturare screenshot collegati alla stessa sessione di trascrizione.
  • Incolla a livello di sistema al cursore attivo: Funziona ovunque tu possa digitare (browser, editor, terminale, ecc.), incollando nella posizione del cursore corrente.
  • YOLO Mode per passaggio rapido ai prompt AI: Quando abilitato, doing preme Return dopo aver incollato la trascrizione per eseguire il prompt senza passaggi extra.
  • Skills per post-elaborazione della trascrizione: Definisci azioni che elaborano la trascrizione prima dell'incolla (esempi mostrati includono formalizzare, riassumere, convertire in prompt codice o sostituire testo con emoji), con comportamento “app-aware” basato su dove incolli.
  • Opzioni motore con benchmark: Include un motore on-device (Parakeet) e può usare chiavi API proprie per motori cloud multipli; comprende un tool di benchmark per testare provider sullo stesso audio.
  • Audio ducking durante la registrazione: Abbassa automaticamente musica/audio all'avvio della registrazione e la ripristina quando smetti.

Come Usare doing

  1. Scarica e installa su Mac (macOS 14+ su Apple Silicon elencato).
  2. In un campo di testo, tieni premuto il tasto di scelta rapida configurato (mostrato come fn Talk) per iniziare l'ascolto.
  3. Parla mentre la trascrizione si aggiorna in tempo reale.
  4. Rilascia il tasto di scelta rapida per incollare la trascrizione alla posizione del cursore.
  5. Opzionalmente cattura screenshot trascinando un rettangolo durante la registrazione e/o abilita YOLO Mode per far premere Return a doing dopo l'incolla.
  6. Se vuoi un comportamento di trascrizione diverso, configura Skills e (dove applicabile) seleziona il motore di trascrizione—quello on-device integrato o motori cloud tramite la tua chiave API.

Casi d'Uso

  • Parla con un assistente AI per coding dal tuo editor: Usa trascrizione vocale e incolla a livello di sistema così la trascrizione atterra direttamente nella casella di input dove lavori, poi premi Return (con YOLO Mode) per inviare.
  • Prepara messaggi strutturati per app diverse: Usa Skills app-aware per riscrivere o formattare la trascrizione per contesti come email (formalizza) o tool di produttività (riassumi in punti elenco).
  • Descrivi bug con contesto visivo: Durante la registrazione vocale, cattura uno o più screenshot così i dettagli visivi sono allegati alla sessione di trascrizione.
  • Genera prompt codice-oriented dall'intento parlato: Usa una Skill code-prompt per convertire una descrizione parlata in un'istruzione tecnica adatta a un assistente coding.
  • Esegui test di trascrizione side-by-side: Usa il tool di benchmark integrato per confrontare il motore on-device con altri motori disponibili usando lo stesso campione audio, scegliendo in base a tradeoff velocità/costo.

FAQ

  • doing carica il mio audio sul cloud? La pagina afferma che doing trascrive localmente senza audio caricato e senza trascrizione cloud.

  • Serve un account per usare doing? Non è richiesto alcun account, come da pagina.

  • Cos'è YOLO Mode e cosa cambia nel workflow? YOLO Mode incolla la trascrizione e poi preme automaticamente Return, così il prompt AI può eseguire immediatamente.

  • doing funziona con screenshot e voce insieme? Sì. Mentre tieni premuto il tasto di scelta rapida, puoi trascinare un rettangolo per catturare screenshot allegati automaticamente alla trascrizione.

  • Posso scegliere motori di trascrizione diversi? La pagina indica che doing include un motore locale (Parakeet) e può usare chiavi API proprie per motori cloud; include anche un tool di benchmark per testare motori sullo stesso audio.

Alternative

  • Trascrizione vocale integrata in macOS (dettatura di sistema): Offre conversione vocale in testo per la digitazione generale, ma non fornisce lo stesso flusso di lavoro con hotkey per trascrizione al cursore, allegato screenshot o “Skills” post-elaborazione descritte per doing.
  • Servizi/API di trascrizione cloud: Richiedono tipicamente l’upload audio e possono comportare account o costi per utilizzo dal provider; doing si posiziona come locale/senza-upload-audio e motori opzionali bring-your-own-key.
  • Altri tool di input vocale AI con abbonamento: La pagina confronta il prezzo una tantum di $49 di doing con altri tool che addebitano $8–15 al mese; le alternative possono differire nel modello di privacy (cloud vs locale) e costo ricorrente.
  • Estensioni per input vocale con hotkey in browser/editor: Possono ridurre la digitazione in app specifiche, ma doing è presentato come system-level e funziona ovunque si possa digitare (non limitato a un singolo sito o editor).
doing | UStack