doing

Qu’est-ce que doing ?

doing est une application Mac pour la saisie vocale et la transcription qui fonctionne localement et conçue pour la confidentialité. Elle écoute quand vous maintenez une touche de raccourci, transcrit votre parole en temps réel et colle le texte résultant à l’emplacement du curseur actif — pour que vous puissiez parler au lieu de taper dans les outils d’IA et tout champ de texte.

L’objectif principal est la transcription sur appareil sans envoi vers le cloud ni compte. Le produit permet aussi d’attacher des captures d’écran à un enregistrement, et propose un post-traitement configurable (« Skills ») avant collage de la transcription.

Fonctionnalités principales

Transcription vocale par maintien de raccourci : Commencez l’écoute en maintenant un raccourci, parlez pendant que le texte est transcrit en temps réel ; relâchez pour coller au curseur.
Gestion audio locale et privée : Conçue pour que votre voix ne quitte jamais votre Mac — pas de transcription cloud, pas de compte, pas d’envoi audio.
Capture d’écran attachée à la transcription : Pendant le maintien du raccourci, tracez un rectangle n’importe où à l’écran pour capturer des screenshots liés à la même session de transcription.
Collage système au curseur actif : Fonctionne partout où vous pouvez taper (navigateur, éditeur, terminal, etc.), en collant à l’emplacement du curseur actuel.
Mode YOLO pour un transfert rapide vers les prompts IA : Activé, doing appuie sur Retour après collage pour exécuter le prompt sans étapes supplémentaires.
Skills pour post-traitement de la transcription : Définissez des actions qui traitent la transcription avant collage (exemples : formaliser, résumer, convertir en prompt code, remplacer texte par emoji), avec comportement « app-aware » selon le lieu de collage.
Options de moteurs avec benchmarks : Livré avec un moteur local (Parakeet) et compatible avec vos propres clés API pour moteurs cloud ; inclut un outil de benchmark pour tester les fournisseurs sur le même audio.
Réduction audio pendant enregistrement : Estompe automatiquement musique/audio au démarrage de l’enregistrement et la restaure à l’arrêt.

Comment utiliser doing

Téléchargez et installez sur Mac (macOS 14+ sur Apple Silicon requis).
Dans un champ de texte, maintenez le raccourci configuré (affiché comme fn Talk) pour commencer l’écoute.
Parlez pendant que la transcription se met à jour en temps réel.
Relâchez le raccourci pour coller la transcription à la position du curseur.
Optionnel : capturez des screenshots en traçant un rectangle pendant l’enregistrement, et/ou activez le Mode YOLO pour que doing appuie sur Retour après collage.
Pour un comportement de transcription différent, configurez les Skills et (si applicable) sélectionnez le moteur — local intégré ou cloud via votre clé API.

Cas d’usage

Parler à un assistant IA de code depuis votre éditeur : Utilisez transcription vocale et collage système pour que le texte arrive directement dans le champ d’entrée, puis appuyez sur Retour (avec Mode YOLO) pour envoyer.
Préparer des messages structurés pour différentes apps : Utilisez Skills app-aware pour reformater votre transcription (ex. formaliser pour email, résumer en puces pour outils productivité).
Décrire des bugs avec contexte visuel : Pendant l’enregistrement vocal, capturez une ou plusieurs screenshots pour attacher les détails visuels à la session de transcription.
Générer des prompts code à partir d’intentions vocales : Utilisez un Skill code-prompt pour convertir une description parlée en instruction technique pour assistant code.
Tester transcriptions côte à côte : Utilisez l’outil benchmark intégré pour comparer le moteur local aux autres sur le même échantillon audio, en choisissant selon vitesse/coût.

FAQ

doing envoie-t-il mon audio vers le cloud ? La page indique que doing transcrit localement sans envoi audio ni transcription cloud.
Ai-je besoin d’un compte pour utiliser doing ? Aucun compte requis, selon la page.
Qu’est-ce que le Mode YOLO et qu’est-ce qu’il change dans le flux ? Le Mode YOLO colle la transcription puis appuie automatiquement sur Retour pour exécuter le prompt IA immédiatement.
doing peut-il combiner screenshots et voix ? Oui. Pendant le maintien du raccourci, tracez un rectangle pour capturer des screenshots attachés automatiquement à la transcription.
Puis-je choisir différents moteurs de transcription ? La page indique que doing est livré avec un moteur local (Parakeet) et compatible avec vos clés API pour moteurs cloud ; inclut un outil benchmark pour tester sur le même audio.

Alternatives

Saisie vocale intégrée à macOS (dictée système) : Fournit une conversion vocale en texte pour la saisie générale, mais ne propose pas le même flux de transcription piloté par raccourci vers le curseur, pièce jointe de capture d’écran ou « Skills » post-traitement décrits pour doing.
Services/API de transcription cloud : Nécessitent généralement le téléversement audio et impliquent souvent des comptes ou des coûts par utilisation ; doing se positionne en local/sans téléversement audio et moteurs optionnels BYOK.
Autres outils de saisie vocale IA avec abonnement : La page compare le prix unique de 49 $ de doing à d’autres outils facturés 8–15 $/mois ; les alternatives diffèrent par modèle de confidentialité (cloud vs local) et coût récurrent.
Extensions de saisie vocale par raccourci pour navigateur/éditeur : Réduisent la saisie dans des apps spécifiques, mais doing est présenté comme système-level, fonctionnant partout où l’on peut taper (non limité à un site ou éditeur unique).

doing

Qu’est-ce que doing ?

Fonctionnalités principales

Comment utiliser doing

Cas d’usage

FAQ

Alternatives

Alternatives

Speech to Text Converter Online

Dictato

Sanota

OpenAI Realtime API

Pewbeam

Voicenotes