speech-core — C++17 engine для on-device голосовых приложений: VAD, потоковый и пакетный STT, диаризация и TTS без облачного инференса.
Voiser.ai — AI text-to-speech и voiceover generator для озвучки текста, с широким выбором голосов и языков для роликов и мультиязычных проектов.
Podio: News Podcast Maker — AI-приложение для подкастов с персональной лентой новостей, дайджестами и эпизодами по темам на iPhone и iPad.
Tico — AI-помощник для Windows: слушает ваши голосовые вопросы, понимает то, что на экране, и дает подсказки с указанием куда нажать.
Yeta AI переводит и озвучивает публичные YouTube-видео в реальном времени ИИ-голосами на 10+ языках. Стартуйте бесплатно: 15 мин/мес, без карты.
Morph объединяет eBooks и аудиокниги в синхронизированном чтении: читайте, слушайте или вместе. Есть Morph AI для вопросов по книге.
FlowSpeech — AI TTS, превращает текст в живую озвучку: контекстные эмоции и точное управление паузами, 30+ голосов и 70+ языков.
API Grok Speech to Text и Text to Speech от xAI: конвертация аудио и текста с низкой задержкой по REST/WebSocket, 25+ языков, диаризация и speech tags.
Gemini 3.1 Flash TTS — текст-в-речь от Google: более естественная выразительная речь, гранулярные аудиотеги для контроля стиля, темпа, 70+ языков, SynthID.
Конфигурируемые правила безопасности и поведения для ElevenAgents: направляют голосовой ИИ и блокируют небезопасные или off-policy ответы до пользователя.
HeyGen Developers — API-платформа для генерации, перевода и lipsync видео с аватарами и TTS-моделями для масштабируемых продакшн-процессов.
Lightning TTS v3 — API синтеза речи с низкой задержкой, многоязычностью и voice cloning для голосовых агентов и продакшн-аудио. $10 free credits при регистрации.
Voxtral TTS — многоязычная TTS-модель Mistral AI для естественной генерации речи с низкой задержкой и адаптацией голосов для voice agent.
Gemini 3.1 Flash Live — реальная аудио и голосовая модель Google для более естественных и надежных голосовых взаимодействий в продуктах и API.
Превращайте статьи в эпизоды подкаста: вставьте ссылку и слушайте в приложении или оформите ежедневную подборку по темам.
Voizematic — AI-голосовой агент для автоматизации звонков: входящие/исходящие, запись в Google Calendar и авто-подтверждения на 25+ языках.
Clipchamp AI Voice Over Generator — онлайн TTS для видео: вставьте текст, получите реалистичный дикторский голос. Выбор языков, темпа и эмоций.
Maestra — AI-платформа для перевода медиа: создает транскрипты, субтитры и многоязычные закадровые (в т.ч. в реальном времени).
Inworld AI: real-time API для текста в речь, распознавания речи и speech-to-speech, а также Router с маршрутизацией и failover между LLM провайдерами.
Fliki создаёт AI-видео и озвучку из текста, идей, PPT, блогов или URL продукта. Мультиязычность, AI-аватары. Бесплатно, без карты.