xAI Grok Speech to Text 및 Text to Speech API로 오디오·텍스트를 변환하세요. REST/WebSocket 저지연, 다국어 지원, 화자 분리·TTS 음성 태그 제공.
Gemini 3.1 Flash TTS는 자연스럽고 표현력 있는 텍스트 음성 변환 모델로, 음성 스타일·속도를 제어하는 오디오 태그와 SynthID 워터마킹을 제공합니다.
ElevenLabs Guardrails 2.0은 ElevenAgents용 안전·행동 제어 레이어로 음성 AI 답변을 안내하고, 위험/정책 위반 출력을 차단합니다.
HeyGen API 기반 플랫폼으로 아바타 영상 생성·번역·립싱크와 TTS 음성 생성까지, 대규모 프로덕션 워크플로에 맞게 개발하세요.
Lightning TTS v3는 Smallest.ai의 저지연 멀티링구얼 TTS API로 음성 에이전트와 프로덕션 오디오에 적합합니다. 가입 시 $10 무료 크레딧.
Voxtral TTS는 Mistral AI의 다국어 TTS 모델로, 음성 에이전트 워크플로에 맞춘 자연스럽고 저지연 음성 생성을 지원합니다.
Gemini 3.1 Flash Live는 Google의 실시간 오디오·음성 모델로, Google 제품에서 더 자연하고 안정적인 음성 상호작용을 지원합니다.
어떤 글이든 팟캐스트 에피소드로 바꿔 들어보세요. 링크를 붙여 팟캐스트 앱에서 재생하거나, 주제별 매일 피드를 구독하세요.
Voizematic은 AI 보이스 에이전트 소프트웨어로 전화 자동화를 구축·배포합니다. 무제한 인바운드/아웃바운드, Google 캘린더 예약, 자동 팔로업(25+ 언어).
Clipchamp AI Voice Over Generator로 온라인 텍스트를 자연스러운 음성 내레이션으로 생성하세요. 앱 다운로드 없이 다국어, 속도, 감정 조절.
Maestra는 AI 미디어 번역 플랫폼으로 자막·대본·다국어 보이스오버를 생성하며, 실시간 번역과 라이브 캡션도 지원합니다.
Inworld AI의 실시간 TTS, STT, realtime speech-to-speech API와 Router로 대화형 앱에서 음성 요청을 라우팅·페일오버하세요.
Fliki는 텍스트·PPT·블로그·제품 URL로 AI 영상과 보이스오버를 제작합니다. 80+ 언어, AI 아바타, 무료 시작(카드 불필요).
WikiTrip은 iPhone에서 주변 Wikipedia 문서를 AI 음성으로 읽어주는 위치 기반 여행 오디오 가이드예요. 걷기·운전·이동 중 핸즈프리 청취.
Synthesys.io의 AI 콘텐츠 스위트로 현실감 있는 아바타 영상 생성, 보이스오버·더빙, 다국어 비디오 및 마케팅용 이미지 제작
CAMB.AI로 단일 라이브 스트림을 다국어로 전송하세요. 실시간 AI 오디오 더빙으로 YouTube, Twitch, X 등에서 더 넓게 도달
LOVO는 100+ 언어의 AI 보이스 제너레이터·TTS로 현실적인 보이스오버를 만들고, 온라인 비디오 편집과 자막 동기화까지 지원합니다.
Herodot AI로 전 세계 어디서나 사진 기반 오디오 가이드와 지도 기반 셀프 투어를 즐기세요. 관심사에 맞춰 청취 가능.
Hume AI의 오픈소스 TADA (Text-Acoustic Dual Alignment) 텍스트-음성 모델로 텍스트와 오디오를 1:1 동기화해 빠르고 안정적인 TTS 생성
Ondoku는 텍스트를 붙여넣으면 선택한 음성으로 읽어주는 TTS 소프트웨어로, 재생 후 .mp3 다운로드와 다국어·음성 선택을 지원합니다.