doing
Trascrizione vocale e input da screenshot per AI su Mac: niente upload su cloud, niente account. Download una tantum da $49.
Cos'è doing?
doing è un'applicazione per Mac per input vocale e trascrizione che funziona localmente e con privacy integrata. Ascolta quando tieni premuto un tasto di scelta rapida, trascrive il tuo discorso in tempo reale e incolla il testo risultante nella posizione del cursore attivo—così puoi parlare invece di digitare mentre usi tool AI e qualsiasi campo di testo.
Lo scopo principale è la trascrizione on-device senza upload su cloud e senza account. Il prodotto supporta anche l'attachment di screenshot a una registrazione e offre post-elaborazione configurabile (“Skills”) prima che la trascrizione venga incollata.
Caratteristiche Principali
- Trascrizione vocale con tasto di scelta rapida tenuto premuto: Inizia l'ascolto tenendo premuto un tasto di scelta rapida, parla mentre il testo viene trascritto in tempo reale; rilascia per incollare al cursore.
- Gestione audio locale e privata: Progettata così che la tua voce non lasci mai il tuo Mac—niente trascrizione cloud, niente account e niente audio caricato.
- Cattura screenshot allegata alla trascrizione: Mentre tieni premuto il tasto di scelta rapida, trascina un rettangolo ovunque sullo schermo per catturare screenshot collegati alla stessa sessione di trascrizione.
- Incolla a livello di sistema al cursore attivo: Funziona ovunque tu possa digitare (browser, editor, terminale, ecc.), incollando nella posizione del cursore corrente.
- YOLO Mode per passaggio rapido ai prompt AI: Quando abilitato, doing preme Return dopo aver incollato la trascrizione per eseguire il prompt senza passaggi extra.
- Skills per post-elaborazione della trascrizione: Definisci azioni che elaborano la trascrizione prima dell'incolla (esempi mostrati includono formalizzare, riassumere, convertire in prompt codice o sostituire testo con emoji), con comportamento “app-aware” basato su dove incolli.
- Opzioni motore con benchmark: Include un motore on-device (Parakeet) e può usare chiavi API proprie per motori cloud multipli; comprende un tool di benchmark per testare provider sullo stesso audio.
- Audio ducking durante la registrazione: Abbassa automaticamente musica/audio all'avvio della registrazione e la ripristina quando smetti.
Come Usare doing
- Scarica e installa su Mac (macOS 14+ su Apple Silicon elencato).
- In un campo di testo, tieni premuto il tasto di scelta rapida configurato (mostrato come fn Talk) per iniziare l'ascolto.
- Parla mentre la trascrizione si aggiorna in tempo reale.
- Rilascia il tasto di scelta rapida per incollare la trascrizione alla posizione del cursore.
- Opzionalmente cattura screenshot trascinando un rettangolo durante la registrazione e/o abilita YOLO Mode per far premere Return a doing dopo l'incolla.
- Se vuoi un comportamento di trascrizione diverso, configura Skills e (dove applicabile) seleziona il motore di trascrizione—quello on-device integrato o motori cloud tramite la tua chiave API.
Casi d'Uso
- Parla con un assistente AI per coding dal tuo editor: Usa trascrizione vocale e incolla a livello di sistema così la trascrizione atterra direttamente nella casella di input dove lavori, poi premi Return (con YOLO Mode) per inviare.
- Prepara messaggi strutturati per app diverse: Usa Skills app-aware per riscrivere o formattare la trascrizione per contesti come email (formalizza) o tool di produttività (riassumi in punti elenco).
- Descrivi bug con contesto visivo: Durante la registrazione vocale, cattura uno o più screenshot così i dettagli visivi sono allegati alla sessione di trascrizione.
- Genera prompt codice-oriented dall'intento parlato: Usa una Skill code-prompt per convertire una descrizione parlata in un'istruzione tecnica adatta a un assistente coding.
- Esegui test di trascrizione side-by-side: Usa il tool di benchmark integrato per confrontare il motore on-device con altri motori disponibili usando lo stesso campione audio, scegliendo in base a tradeoff velocità/costo.
FAQ
-
doing carica il mio audio sul cloud? La pagina afferma che doing trascrive localmente senza audio caricato e senza trascrizione cloud.
-
Serve un account per usare doing? Non è richiesto alcun account, come da pagina.
-
Cos'è YOLO Mode e cosa cambia nel workflow? YOLO Mode incolla la trascrizione e poi preme automaticamente Return, così il prompt AI può eseguire immediatamente.
-
doing funziona con screenshot e voce insieme? Sì. Mentre tieni premuto il tasto di scelta rapida, puoi trascinare un rettangolo per catturare screenshot allegati automaticamente alla trascrizione.
-
Posso scegliere motori di trascrizione diversi? La pagina indica che doing include un motore locale (Parakeet) e può usare chiavi API proprie per motori cloud; include anche un tool di benchmark per testare motori sullo stesso audio.
Alternative
- Trascrizione vocale integrata in macOS (dettatura di sistema): Offre conversione vocale in testo per la digitazione generale, ma non fornisce lo stesso flusso di lavoro con hotkey per trascrizione al cursore, allegato screenshot o “Skills” post-elaborazione descritte per doing.
- Servizi/API di trascrizione cloud: Richiedono tipicamente l’upload audio e possono comportare account o costi per utilizzo dal provider; doing si posiziona come locale/senza-upload-audio e motori opzionali bring-your-own-key.
- Altri tool di input vocale AI con abbonamento: La pagina confronta il prezzo una tantum di $49 di doing con altri tool che addebitano $8–15 al mese; le alternative possono differire nel modello di privacy (cloud vs locale) e costo ricorrente.
- Estensioni per input vocale con hotkey in browser/editor: Possono ridurre la digitazione in app specifiche, ma doing è presentato come system-level e funziona ovunque si possa digitare (non limitato a un singolo sito o editor).
Alternative
Speech to Text Converter Online
Uno strumento online gratuito che converte file audio e video in accurate trascrizioni di testo in oltre 45 lingue. Supporta numerosi formati di file e non richiede download o registrazioni.
Dictato
Dictato: app offline di dettatura vocale per macOS. Trascrive sul dispositivo e inserisce il testo ovunque stai scrivendo, senza cloud.}}
Memo AI
Servizio di trascrizione alimentato da IA che converte file audio e video in testo.
Sanota
Sanota trasforma la tua voce in testo chiaro e bello: cattura ricordi e idee facilmente e inizia gratis.
OpenAI Realtime API
Con OpenAI Realtime API crea esperienze vocali e audio in tempo reale a bassa latenza, multimodali, con agenti vocali web e trascrizione realtime.
Pewbeam
Pewbeam ascolta mentre predichi, rileva in tempo reale i versetti della Bibbia e li mostra subito su schermo, senza digitare o cliccare.