L'API Temps Réel d'OpenAI facilite la communication multimodale à faible latence pour construire des applications telles que des agents vocaux, prenant en charge la parole-vers-parole, les entrées audio/image/texte, et les sorties audio/texte.
Zavi AI est un clavier de saisie vocale avancé qui transforme instantanément la parole naturelle en texte propre et professionnel, supprimant automatiquement les mots de remplissage et corrigeant la grammaire dans toutes les applications.
Dictato est une application de dictée privée, fonctionnant sur l'appareil pour Mac, qui convertit instantanément la parole en texte dans toutes les applications en utilisant les moteurs Whisper, Parakeet ou Apple.
Thinklet est une application de prise de notes pilotée par l'IA et axée sur la voix, qui transcrit instantanément les pensées parlées en notes organisées et permet aux utilisateurs de discuter avec leur base de connaissances localement sur l'appareil.
Willow Voice est un logiciel de dictée IA intelligent et sensible au contexte, disponible pour Mac, Windows et iOS, conçu pour stimuler la productivité en transformant la parole naturelle en texte parfait instantanément.
闪电说 AI 语音输入法 est un outil de saisie vocale basé sur l'IA, privilégiant le traitement local, qui prétend être 4 fois plus rapide que la dactylographie traditionnelle, offrant une réponse en millisecondes et une puissante fonction de correction intelligente par IA, compatible avec toutes les applications.
ClawdTalk comble le fossé entre les robots textuels (comme ceux construits avec OpenClaw) et la communication vocale du monde réel, permettant aux utilisateurs d'appeler leurs robots comme un appel téléphonique.
Un outil en ligne gratuit qui convertit les fichiers audio et vidéo en transcriptions textuelles précises dans plus de 45 langues. Il prend en charge de nombreux formats de fichiers et ne nécessite aucun téléchargement ni inscription.
MiniCPM-o 4.5 est un modèle d'IA multimodal hautement performant, conçu pour la vision, la parole et la diffusion en direct en duplex intégral, offrant une compréhension visuelle avancée, une synthèse vocale et des capacités interactives en temps réel dans une architecture compacte de 9 milliards de paramètres.
Voxtral est une solution avancée de conversion de la parole en texte développée par Mistral AI, conçue pour fournir des services de transcription précis, en temps réel et par lots. Elle exploite des modèles de nouvelle génération pour offrir une qualité de transcription de premier ordre, une diarisation des locuteurs et un traitement à faible latence, rendant son utilisation adaptée à une large gamme d'applications vocales. La suite de Voxtral inclut des modèles de transcription en batch et en direct, optimisés pour différents cas d'usage, et est conçue avec la confidentialité et l'efficacité en tête. La plateforme se distingue par sa capacité à gérer la transcription multilingue dans 13 langues, à supporter des enregistrements audio longs jusqu'à trois heures, et par la disponibilité open-source des modèles sous licence Apache 2.0. Elle comprend également un environnement interactif dans Mistral Studio, permettant aux utilisateurs de tester et d'expérimenter instantanément avec les fonctionnalités de transcription. Que ce soit pour un déploiement en entreprise, la production médiatique ou des applications vocales en temps réel, Voxtral vise à transformer la manière dont les organisations utilisent les données vocales.

Votre IA personnelle qui se souvient de tout ce que vous voyez, dites et entendez. Gratuite, open source, 100% locale.

Voice Anywhere est un outil de dictée instantanée pour macOS qui convertit votre discours en texte dans n'importe quelle application instantanément.
Sayline est la manière la plus productive de taper, permettant aux utilisateurs de dicter du texte rapidement et efficacement grâce à une puissante technologie de dictée par IA.
TalkMirror est un outil professionnel de rétroaction vocale conçu pour les apprenants en langues, les orateurs publics et les acteurs, fournissant une autocorrection instantanée grâce à la réflexion vocale.
Qlay propose une supervision de proctoring alimentée par l'IA pour des processus d'évaluation transparents.

Convertissez la parole en texte sans effort grâce à l'extension Chrome de BlabbyAI.
Poised est un coach de communication alimenté par l'IA qui fournit des retours en temps réel pour vous aider à parler avec confiance lors des appels.
Service de transcription alimenté par l'IA qui convertit des fichiers audio et vidéo en texte.
AIMIX智剪 est un logiciel de montage vidéo intelligent qui permet la production rapide en lot de vidéos courtes originales, en tirant parti de l'IA pour des fonctionnalités telles que la génération automatique de sous-titres et la synthèse vocale.
AssemblyAI fournit des modèles de Speech AI de pointe pour transcrire la parole en texte et extraire des informations à partir de données vocales.