Gemini 3.5 Live Translate é o modelo de áudio da Google para tradução de voz quase em tempo real em mais de 70 idiomas. Ideal para chamadas, reuniões e aulas.
PodWalk: Guided Tours cria tours a pé em áudio por localização para cidades, bairros e ruas, com reprodução offline e suporte a vários idiomas.
MAI-Voice-2 da Microsoft AI transforma texto em fala natural e expressiva, com suporte a 15 idiomas, controle de emoção e referência de áudio.
Voiser.ai é um gerador de texto para voz e locução com IA, com vozes naturais e vários idiomas para narração, marketing e projetos multilíngues.
Our Stories é uma plataforma multilingue para famílias partilharem histórias: ler, ouvir e partilhar uma mesma história em vários idiomas, à distância.
Wallie é um framework open-source de AI streamer com visão em tempo real, perfis de personalidade, chat, TTS e avatar para streams no Twitch, YouTube ou Kick.
Podio: News Podcast Maker é um app de áudio com IA que transforma temas e interesses em um podcast diário personalizado no iPhone e iPad.
Reader Alive é um leitor de ebooks com IA para iPhone e iPad, compatível com EPUB, PDF, MOBI e AZW3, com tradução, leitura em voz alta e chat sobre o livro.
Com o Selectable, capture e extraia texto de qualquer parte da tela do Mac (imagens e vídeos), traduza instantaneamente, use TTS e masque dados sensíveis.
FlowSpeech é uma ferramenta de IA de texto para fala que gera áudio com emoção dependente do contexto e pausas precisas, com 30+ vozes e 70+ idiomas.
Gemini 3.1 Flash TTS é o modelo TTS do Google que cria fala de IA mais natural e expressiva, com tags de áudio e SynthID em 70+ idiomas.
Lightning TTS v3 é a API de texto-para-fala da Smallest.ai com baixa latência, fala multilíngue e voice cloning, para agentes e áudio.
Claude Voice Mode permite conversar com Claude por voz, ouvir respostas e alternar entre voz e texto na mesma conversa.
Leia o Alcorão online grátis com recitação em áudio e traduções, incluindo análise palavra por palavra em 18 idiomas.
Voxtral TTS é o modelo de texto-para-voz multilíngue da Mistral AI, com baixa latência e vozes adaptáveis para fluxos de voice agents.
Clipchamp AI Voice Over Generator é uma ferramenta online de texto para fala (TTS) para criar narrações realistas em vídeo, sem baixar o app.
LOVO é um gerador de voz por IA e TTS que cria narrações realistas em 100+ idiomas, com editor de vídeo online para sincronizar e legendas.
TADA (Text-Acoustic Dual Alignment) é um modelo open-source de text-to-speech da Hume AI que sincroniza texto e áudio um-para-um.
Ondoku é um software TTS que lê o texto colado com a voz escolhida e permite baixar em .mp3. Suporta vários idiomas e vozes.
Xeder é uma extensão para Chrome que lê seu feed do X (Twitter) em voz alta, para você acompanhar as atualizações enquanto faz outras coisas.