speech-core è un motore pipeline C++17 on-device per VAD, speech-to-text batch e streaming, diarizzazione e text-to-speech locali, senza cloud.
Voiser.ai è un generatore AI di text-to-speech e voiceover che trasforma testi in audio parlato, con molte voci e lingue per contenuti multilingue.
Podio: News Podcast Maker è un'app audio con AI che trasforma temi e interessi in un podcast quotidiano personalizzato per ascoltare notizie e approfondimenti hands-free su iPhone e iPad.
Tico è un assistente AI per Windows: ascolta le tue domande a voce, capisce cosa vedi sullo schermo e ti guida indicando dove cliccare.
Yeta AI traduce e sincronizza in tempo reale video YouTube pubblici con voci AI in 10+ lingue. Piano gratis: 15 min/mese, senza carta.
Morph unisce ebook e audiolibri in un’esperienza sincronizzata: leggi, ascolta o entrambi. Include un assistente AI per domande sui libri e spiegazioni.
FlowSpeech è un tool AI text-to-speech: trasforma script in audio realistico con emozioni contestuali e pause precise, con 30+ voci e 70+ lingue.
xAI offre API Grok Speech to Text (STT) e Text to Speech (TTS) con endpoint REST/WebSocket a bassa latenza, supporto multilingue, diarizzazione.
Gemini 3.1 Flash TTS di Google: modello TTS che genera voce AI più naturale ed espressiva, con audio tag granulari e watermark SynthID per 70+ lingue.
Controlli di sicurezza e comportamento configurabili per ElevenAgents: guidano le risposte AI vocali e bloccano contenuti non sicuri o fuori policy.
HeyGen Developers: piattaforma API per generare, tradurre e lipsync video con avatar e TTS. Progettata per workflow di produzione scalabili.
Lightning TTS v3 di Smallest.ai: API TTS a bassa latenza con parlato multilingue e voice cloning per voice agent e audio di produzione. $10 crediti gratis.
Voxtral TTS di Mistral AI: modello TTS multilingue per generazione vocale naturale a bassa latenza, con voci adattabili per voice agent.
Gemini 3.1 Flash Live di Google è il modello audio e voce in tempo reale per interazioni vocali più naturali e affidabili su prodotti e API.
Trasforma qualsiasi articolo in un episodio podcast: incolla un link per ascoltarlo nella tua app o iscriviti a un feed giornaliero per argomento.
Voizematic è un software per agenti vocali AI: automatizza chiamate in entrata e in uscita, prenotazioni su Google Calendar e follow-up in 25+ lingue.
Clipchamp AI Voice Over Generator è uno strumento online testo-a-voce per creare una voce fuori campo realistica per i video. Scegli lingue, velocità ed emozioni.
Maestra è una piattaforma di traduzione media AI: genera trascrizioni, sottotitoli e voiceover multilingue, inclusi live captions e traduzione in tempo reale.
Inworld AI offre API real-time text-to-speech, speech-to-text e speech-to-speech, più un Router per selezione e failover tra LLM.
Fliki crea video AI e voiceover da testo, idee, PPT, blog o URL prodotto, con supporto multilingue e avatar AI. Piano free senza carta.