Signal Recorder SR-7 é um app de gravação de voz para Mac e iPhone que transcreve áudio no dispositivo, gera títulos e resumos locais e exporta em Markdown.
speech-core é um motor de pipeline de agente de voz em C++17 para VAD, speech-to-text em streaming e em lote, diarização e text-to-speech local.
API de tradução de voz em tempo real da Krisp para chamadas ao vivo e apps de voz. Traduz conversas em 61 idiomas com cancelamento de vozes de fundo.
Vox é um app de ditado por AI para Mac e Windows que converte sua fala em texto revisado na área de transferência, com processamento local e uso offline.
Wave é uma app nativa de ditado para macOS que converte fala em texto no cursor, com Whisper local offline ou Groq para transcrição mais rápida.
Daisy é um gravador de reuniões e app de ditado open source para Mac, com foco local, que grava e transcreve no dispositivo e salva em markdown.
LocalClicky é um assistente de voz para macOS que funciona localmente, transcreve fala, interpreta comandos, analisa a tela e controla o Mac sem cloud.
Sun é uma API de voz em tempo real para interação colaborativa em apps e produtos, ideal para developers que precisam de experiências de voz ao vivo além do chat individual.
Ringg Parrot STT V1 é uma API de speech-to-text para transcrição em tempo real e de arquivos de Hindi, inglês e fala code-mixed, com integração Python.
TongueType é um app de ditado por voz para macOS que transcreve localmente com Whisper AI e insere texto no cursor. Sem cloud, contas ou subscrições.
Carbon Voice é um app de mensagens de voz assíncronas para equipes, com pessoas e agentes de IA. Envie atualizações transcritas, responda por voz ou texto e use no desktop, mobile, watch e widgets.
Tico é um assistente de IA para Windows: ouve suas perguntas, entende o que está na tela e dá orientação falada, apontando onde clicar.
Snaply grava reuniões no seu Mac e cria um transcript completo, resumo limpo e itens de ação—processados localmente para privacidade.
Memoket Gem é um dispositivo vestível que grava conversas e transforma em contexto para usar com ferramentas de IA, com captura “pressione uma vez”.
Crie voice agents com a AssemblyAI Voice Agent API: faça streaming de áudio e receba saída de voz em tempo real. Transcrição detalhada, tags e papéis.
Ora é um intérprete simultâneo pessoal no dispositivo para macOS: traduz o áudio falado em tempo real com legendas parciais, sem enviar para servidores externos.
SpeakMac é um app de ditado fala-para-texto offline para Mac: converte voz em texto na janela ativa, com processamento local e licença vitalícia.
SpeakON transforma sua fala em texto bem formatado no iPhone: basta um toque, falar e enviar/colar na app onde você está escrevendo.
Harker é um app gratuito de voz-para-texto para macOS: dite em qualquer app com um atalho global. No Premium, há estilos de escrita e tradução.
APIs da xAI para Grok Speech to Text (STT) e Text to Speech (TTS): conversão de áudio e texto com endpoints REST/WebSocket de baixa latência.