Converta áudio e vídeo em texto com HypeScribe, o serviço de transcrição AI com resumos inteligentes, insights e colaboração. Transcrições rápidas e precisas.
A OpenAI Realtime API facilita a comunicação multimodal de baixa latência para a criação de aplicações como agentes de voz, suportando fala-para-fala, entradas de áudio/imagem/texto e saídas de áudio/texto.
Zavi AI é um teclado de digitação por voz avançado que transforma a fala natural em texto limpo e profissional instantaneamente, removendo automaticamente palavras de preenchimento e corrigindo a gramática em todos os aplicativos.
Dictato é um aplicativo de ditado privado, executado no dispositivo, para Mac que converte fala em texto instantaneamente em todos os aplicativos usando os motores Whisper, Parakeet ou Apple.
Thinklet é um aplicativo de anotações com foco em voz e alimentado por IA que transcreve instantaneamente pensamentos falados em notas organizadas e permite que os usuários conversem com sua base de conhecimento localmente no dispositivo.
Willow Voice é um software de ditado de fala para texto com IA inteligente e consciente do contexto, disponível para Mac, Windows e iOS, projetado para aumentar a produtividade, transformando a fala natural em texto perfeito instantaneamente.
闪电说 AI 语音输入法 é uma ferramenta de entrada de voz com IA, priorizando o processamento local, que afirma ser até 4 vezes mais rápida que a digitação tradicional, oferecendo resposta em nível de milissegundo e poderosos recursos de correção inteligente de IA, compatível com todos os aplicativos.
ClawdTalk preenche a lacuna entre bots baseados em texto (como os criados com OpenClaw) e comunicação de voz do mundo real, permitindo que os usuários liguem para seus bots como se fosse uma chamada telefônica.
Uma ferramenta online gratuita que converte ficheiros de áudio e vídeo em transcrições de texto precisas em mais de 45 idiomas. Suporta inúmeros formatos de ficheiro e não requer downloads ou registos.
MiniCPM-o 4.5 é um modelo de IA multimodal altamente capaz, projetado para visão, fala e transmissão ao vivo full-duplex, oferecendo compreensão visual avançada, síntese de fala e capacidades interativas em tempo real, em uma arquitetura compacta de 9 bilhões de parâmetros.
Voxtral é uma solução de reconhecimento de fala avançada desenvolvida pela Mistral AI, projetada para fornecer serviços de transcrição de alta precisão, em tempo real e em lote. Ela utiliza modelos de próxima geração para oferecer uma qualidade de transcrição líder na indústria, diarização de falantes e processamento de baixa latência, tornando-se adequada para uma ampla variedade de aplicações baseadas em voz. O conjunto do Voxtral inclui modelos de transcrição em lote e ao vivo, otimizados para diferentes casos de uso, e é construído com foco na privacidade e eficiência.

Sua IA pessoal que lembra de tudo o que você vê, diz e ouve. Gratuita, código aberto, 100% local.

Voice Anywhere é uma ferramenta de ditado instantâneo para macOS que converte sua fala em texto em qualquer aplicativo instantaneamente.
Sayline é a maneira mais produtiva de digitar, permitindo que os usuários ditem texto de forma rápida e eficiente com uma poderosa tecnologia de ditado por IA.
TalkMirror é uma ferramenta profissional de feedback de voz projetada para estudantes de idiomas, palestrantes públicos e atores, proporcionando autocorreção instantânea através da reflexão vocal.
Qlay oferece supervisão de proctoring alimentada por IA para processos de avaliação transparentes.

Converta fala em texto sem esforço com a extensão Chrome do BlabbyAI.
Poised é um coach de comunicação impulsionado por IA que fornece feedback em tempo real para ajudá-lo a falar com confiança durante as chamadas.
Serviço de transcrição impulsionado por IA que converte arquivos de áudio e vídeo em texto.
AIMIX智剪 é um software de edição de vídeo inteligente que permite a produção rápida em lote de vídeos curtos originais, aproveitando a IA para recursos como geração automática de legendas e síntese de voz.