Gemini 3.5 Live Translateは、70以上の言語に対応するGoogleの音声モデル。通話、会議、授業、配信、Google製品の翻訳機能向けに、ほぼリアルタイムの音声翻訳を実現します。
PodWalk: Guided Toursは、都市・町・地区・通り向けの位置情報ベース音声ウォーキングツアーを生成。旅行者や地元の人に、ハンズフリーのナレーション再生、オフライン再生、多言語対応を提供します。
MAI-Voice-2は、Microsoft AIのテキスト読み上げモデル。テキストから自然で表情豊かな音声を生成し、15言語、感情制御、参照音声による音声プロンプトに対応。
Voiser.aiは、テキストを音声に変換するAI音声合成・ナレーション生成ツールです。多彩な音声と言語に対応し、ナレーションやプロモーション、多言語制作に活用できます。
Our Storiesは、家族向けの多言語ストーリー共有サービス。1つの物語を家族の言語で読み、聴き、遠く離れた家族とも共有できます。
Wallieは、リアルタイム視覚、設定可能な人格プロファイル、チャット連携、音声合成、アバター出力を備えたオープンソースのAI配信フレームワーク。Twitch、YouTube、Kick向けのVTuber・AI配信に最適。
Podio: News Podcast Makerは、選んだ話題や関心に合わせて毎日のパーソナライズ音声ニュースを作成するAI搭載アプリ。iPhoneとiPadで、ニュースや要約、カスタム番組をハンズフリーで聴けます。
Reader Aliveは、iPhoneとiPad向けのAI搭載電子書籍リーダー。EPUB、PDF、MOBI、AZW3に対応し、翻訳、自然な読み上げ、章要約、書籍内容に基づくチャットを備えています。
SelectableでMac画面のどこからでも文字をキャプチャ・抽出。画像/動画の文字も翻訳(macOS 26+)やTTS再生、機密データをマスク。
FlowSpeechは、スクリプトを文脈に合う感情と正確なポーズ制御で人間らしい音声へ変換。30+ボイス/70+言語に対応。
Gemini 3.1 Flash TTSはGoogleの音声合成モデル。自然で表現豊かなAI音声を生成し、音声タグで話し方とテンポを制御。70+言語対応、SynthIDウォーターマーク。
Lightning TTS v3 は低遅延・多言語の音声合成API。ボイスエージェントや制作向けの音声、ボイスクローン対応。登録で$10無料クレジット。
Claude Voice Modeは、Claudeと話して音声で返答を聞けるベータ機能。会話内で音声とテキストを切り替え可能。
easyquran.aiで無料にオンラインでクルアーンを音声朗読と翻訳付きで読む。18言語の語ごとの分析も対応。
Voxtral TTSはMistral AIの多言語TTSモデル。自然で低遅延な音声生成と、音声エージェント向けに話者を適応するボイスモデルを提供。
Clipchamp AI Voice Over Generatorは、オンラインのテキスト読み上げ(TTS)で字幕に使える本格的な音声ナレーションを作成。多言語・速度・感情調整対応。
LOVOはAI音声生成・テキスト読み上げで100以上の言語に対応。オンライン動画編集で同期と字幕作成まで可能。
TADA (Text-Acoustic Dual Alignment) は Hume AI のオープンソース音声合成モデル。テキストと音声を1対1で同期し高速・安定生成を目指します。
Ondoku は、貼り付けたテキストを選択した音声で読み上げ。再生できるほか .mp3 でダウンロード可能。多言語・複数音声対応。
XederはChrome拡張。X(Twitter)のフィードを読み上げ、手や目を離して更新を音声で聴けます。