Signal Recorder SR-7 est une app d’enregistrement vocal pour Mac et iPhone qui transcrit l’audio hors ligne, crée titres et résumés locaux, et exporte en Markdown.
speech-core est un moteur C++17 de pipeline voix sur appareil pour VAD, transcription speech-to-text en flux ou par lots, diarisation et text-to-speech.
Krisp Voice Translation API est une API de traduction vocale en temps réel pour appels et applis, avec 61 langues, annulation du bruit et vocabulaire personnalisé.
Vox est une application de dictée IA sur appareil pour Mac et Windows qui transforme la parole en texte nettoyé dans votre presse-papiers, hors ligne et sans compte.
Wave est une app native de dictée pour macOS qui transforme la parole en texte au curseur, avec Whisper local hors ligne ou Groq plus rapide.
Daisy est une app open source pour Mac, locale par défaut, qui enregistre vos réunions et dicte en local, avec transcriptions markdown et serveur MCP local.
LocalClicky est un assistant vocal macOS local pour transcrire la voix, exécuter des commandes, analyser l’écran et contrôler le Mac hors ligne.
Sun est une API voix temps réel pour des interactions vocales collaboratives dans les applications. Pensée pour les développeurs, au-delà du chat à deux.
Ringg Parrot STT V1 est une API de speech-to-text pour la transcription en temps réel et à partir de fichiers, pour l’hindi, l’anglais et le code-mix.
TongueType est une app de dictée vocale pour macOS qui transcrit localement avec Whisper AI et insère le texte au curseur, sans cloud, compte ni abonnement.
Carbon Voice est une app de messagerie vocale asynchrone pour équipes, avec transcription, réponses par voix ou texte, et accès sur desktop, mobile, montre et widgets.
Tico est un assistant IA pour Windows : il écoute vos questions à la voix, comprend ce que vous voyez à l’écran et guide où cliquer.
Snaply enregistre vos réunions sur Mac et crée un transcript complet, un résumé clair et des actions, traités en local pour préserver la confidentialité.
Memoket Gem, appareil portable, enregistre vos conversations puis les transforme en contexte exploitable pour des outils d’IA via “pression unique”.
Créez des agents vocaux avec l’AssemblyAI Voice Agent API : diffusez l’audio en continu et recevez la sortie vocale, avec options de transcription.
Ora est un interprète simultané personnel sur macOS : traduction en temps réel avec sous-titres partiels, sans envoyer l’audio à des serveurs externes.
SpeakMac transforme votre voix en texte hors ligne sur Mac, directement dans la fenêtre active. Reconnaissance 25+ langues, licence à paiement unique.
SpeakON est un dictaphone pour iPhone : une pression, vous parlez, et du texte soigné apparaît dans l’app où vous rédigez.
Harker est une app gratuite de dictée voix-texte sur macOS : dictez partout grâce à un raccourci global. Premium ajoute styles IA, formatage et traduction.
APIs Grok Speech to Text et Text to Speech d’xAI : conversion audio/texte à faible latence via REST/WebSocket, support multilingue et diarisation.