テキスト、歌唱、ラップの生成
テキストから音声、歌声、ラップを生成でき、別のテキスト読み上げ体験と、自動生成を行いたい開発者向けのAPI経路も用意されています。
Uberduckは、テキストや録音済み音声から、音声、歌唱、ラップ、音声クローン、合成音楽を生成できるAI音声・音楽プラットフォームです。サイトでは、メディア制作や製品ワークフロー向けに、リアルな合成ボーカルを必要とするクリエイター、代理店、マーケター、ミュージシャン、開発者向けのツールとして紹介されています。
製品ページでは、テキストを音声に変換すること、カスタムボイスを作成すること、ある声を別の声へ変換すること、オリジナル音楽を生成することという主要な用途に重点を置いています。料金ページではStarter、Creator、Proの段階的なプランが示され、音声クローンページでは無料の入口と、APIアクセス付きの有料商用プランへ拡張できることが強調されています。
テキストから音声、歌声、ラップを生成でき、別のテキスト読み上げ体験と、自動生成を行いたい開発者向けのAPI経路も用意されています。
音声またはマイク録音から声をクローンし、その声を読み上げや音声変換に使用できます。製品では、クローンした声で話す、歌う、ラップすることもできると説明しています。
話者のスタイルを保ちながら別の声へ変換し、クリエイティブ用途や制作用途で音声変換のワークフローを利用できます。
プロンプトからAI音楽を作成でき、曲、トラック、ジングル、BGMなどに対応します。音楽ページでは、70以上の言語と数百種類の音楽スタイルをサポートしていると説明しています。
テキスト読み上げページでは、多言語音声や豊富な音声カタログから選択でき、人間らしい音声や多言語ニューラル音声の例も掲載されています。
有料プランを使うことで、商用出力やより大規模なワークフローに対応できます。料金ページでは、CreatorとProに商用ライセンスが含まれ、APIアクセスとより多い月間クレジットも用意されています。
動画、解説コンテンツ、その他の合成音声が必要なメディア向けに、ナレーション、キャラクターのセリフ、多言語のボイスオーバーを生成できます。
話者が毎回すべてのセリフを録音できない場合に、ポッドキャストの挿入部分、広告読み上げ、オーディオブック、カスタム音声素材用に声をクローンできます。
サイトで案内されているAPI経路を使い、テキスト読み上げ、歌声生成、ラップ生成、音声変換を含む音声体験を製品に組み込めます。
AI音楽ツールを使って、SNS、ゲーム、イベント、ブランドコンテンツ向けに、オリジナルの曲、ジングル、イントロ、BGMトラックを作成できます。
別の音声表現が必要なときに、キャラクター、エンターテインメント、スピーチ・トゥ・スピーチ変換向けの代替ボイススタイルを生成できます。
Uberduckは、テキスト読み上げ、音声クローン、音声変換、AI音楽生成のためのAI音声ツールを提供します。サイトでは、クリエイター、ミュージシャン、マーケター、代理店、音声対応製品を構築するチーム向けに位置づけられています。
ソースでは、テキスト読み上げ、音声クローン、音声変換、AI音楽生成が示されています。また、テキスト読み上げ、歌声生成、ラップ生成、音声変換向けのAPIにも触れており、音声クローンページではエンタープライズプランのAPIアクセスにも言及しています。
料金ページには、Starter、Creator、Proのプランが掲載されています。CreatorとProプランには商用利用ライセンスとAPIアクセスが含まれ、Starterは非商用オプションとして説明されています。
テキスト読み上げページと音声クローンページの両方で、多言語対応が強調されており、ソース全体で70以上の言語が繰り返し参照されています。テキスト読み上げページには、利用可能な音声の長い一覧も表示されています。
ソースによると、音声クローンは数秒で実行でき、音声クローンページで無料で利用できます。料金ページには、商用機能とより多いクレジット上限を備えた有料プランも記載されています。
Typecast is an online AI voice generator that turns text into life-like speech with emotional delivery and a selection of hyper-realistic voices. It is a browser-based tool for creating spoken audio from written content.
Gemini 3.1 Flash TTS is Google’s preview text-to-speech model for generating expressive AI speech with fine-grained control over style and delivery. It is available across the Gemini API, Google AI Studio, Vertex AI, and Google Vids.
蓝藻AI是一款在线AI配音与语音合成产品,可将文字转成语音,并支持自助声音克隆。页面信息显示它面向短视频、有声书等需要配音的内容场景。
Ondokuは、ブラウザで使える文字起こし・音声化ソフトです。テキストを.mp3でダウンロードでき、無料枠と有料プラン、多言語読み上げ、画像読み上げ、条件付き商用利用に対応します。
Noiz AI is an AI text-to-speech, voice cloning, and voice design tool for creating lifelike speech from text. It also lets users shape voice delivery, including emotion, within the same workflow.
魔音工坊 (Moying Gongfang) は、書かれたテキストをリアルな人間の声と様々なアクセントを使用して高品質のナレーションに変換するインテリジェントなオンラインテキスト読み上げ (TTS) プラットフォームです。