speech-core é um motor de pipeline de agente de voz em C++17 para VAD, speech-to-text em streaming e em lote, diarização e text-to-speech local.
Voiser.ai é um gerador de texto para voz e locução com IA, com vozes naturais e vários idiomas para narração, marketing e projetos multilíngues.
Podio: News Podcast Maker é um app de áudio com IA que transforma temas e interesses em um podcast diário personalizado no iPhone e iPad.
Tico é um assistente de IA para Windows: ouve suas perguntas, entende o que está na tela e dá orientação falada, apontando onde clicar.
Yeta AI traduz e dublar vídeos do YouTube em tempo real com vozes de IA em 10+ idiomas. Comece grátis com 15 min/mês—sem cartão.
Morph combina eBooks e audiobooks em leitura sincronizada: leia, ouça ou ambos. Inclui assistente de IA para perguntas e explicações por capítulo.
FlowSpeech é uma ferramenta de IA de texto para fala que gera áudio com emoção dependente do contexto e pausas precisas, com 30+ vozes e 70+ idiomas.
APIs da xAI para Grok Speech to Text (STT) e Text to Speech (TTS): conversão de áudio e texto com endpoints REST/WebSocket de baixa latência.
Gemini 3.1 Flash TTS é o modelo TTS do Google que cria fala de IA mais natural e expressiva, com tags de áudio e SynthID em 70+ idiomas.
Controles de segurança e comportamento configuráveis para ElevenAgents, orientam respostas de AI por voz e bloqueiam saídas inseguras ou fora da política.
HeyGen Developers: plataforma API para gerar, traduzir e fazer lipsync de vídeos com avatares e TTS, pronta para fluxos de produção em escala.
Lightning TTS v3 é a API de texto-para-fala da Smallest.ai com baixa latência, fala multilíngue e voice cloning, para agentes e áudio.
Voxtral TTS é o modelo de texto-para-voz multilíngue da Mistral AI, com baixa latência e vozes adaptáveis para fluxos de voice agents.
Gemini 3.1 Flash Live é o modelo de áudio e voz em tempo real da Google para interações mais naturais e confiáveis em produtos e APIs.
Transforme qualquer artigo em um episódio de podcast: cole o link no listen. e escute no app ou assine um feed diário por tópicos.
Voizematic é software de agente de voz com IA para automatizar ligações ilimitadas, agendamentos no Google Calendar e follow-ups em 25+ idiomas.
Clipchamp AI Voice Over Generator é uma ferramenta online de texto para fala (TTS) para criar narrações realistas em vídeo, sem baixar o app.
Maestra é uma plataforma de tradução de mídia com IA que gera transcrições, legendas e voiceovers multilíngues, incluindo tradução em tempo real e legendas ao vivo.
Inworld AI oferece APIs em tempo real de texto-para-voz, voz-para-texto e voz-para-voz, além do Router com failover entre vários LLMs.
Crie vídeos de IA e voiceovers a partir de texto, ideias, PPTs, blogs ou URLs de produtos com suporte multilíngue e avatares. Comece grátis, sem cartão.