Gemini 3.5 Live Translate 是 Google 的音频模型,可在 70+ 种语言间实现近乎实时的语音到语音翻译,适用于通话、会议、课程、直播及 Google 产品中的翻译功能。
PodWalk: Guided Tours 为城市、城镇、社区和街道生成基于位置的音频徒步导览。适合游客和本地人,支持免手持讲解、离线播放与多语言。
MAI-Voice-2 是 Microsoft AI 的文本转语音模型,可将文本生成自然、富有表现力的语音。支持15种语言、情感控制、参考音频语音提示,适用于助手、客服、有声书和无障碍场景。
Voiser.ai 是一款 AI 文本转语音和配音生成器,可将书面文本转换为语音音频。支持多种声音和语言,适用于旁白、推广内容和多语言项目。
Our Stories 是一款面向家庭的多语言故事分享产品,让同一个故事可按家人使用的语言阅读、聆听并分享,跨越距离与语言差异。
Wallie 是一款开源 AI 直播框架,支持实时视觉、可配置人格、聊天互动、TTS 与头像输出,适合在 Twitch、YouTube 或 Kick 上打造 VTuber 风格或 AI 驱动直播。
Podio:News Podcast Maker,AI 音频应用,将你关注的主题和新闻兴趣转化为个性化每日播客流。可在 iPhone 和 iPad 上免手操作收听新闻、摘要和自定义话题节目。
Reader Alive 是一款适用于 iPhone 和 iPad 的 AI 电子书阅读器,支持 EPUB、PDF、MOBI 和 AZW3 文件,并提供翻译、自然语音朗读、章节摘要与基于书籍内容的聊天功能,适合阅读个人电子书。
Selectable 可从 Mac 屏幕任意位置捕获并提取文字(含图片/视频),支持复制后自动翻译(macOS 26+)、TTS 朗读与敏感数据遮蔽。
FlowSpeech 是 AI 文本转语音工具,可将脚本生成拟人音频,支持情感与精确停顿控制,提供 30+ 声音、70+ 语言。
Gemini 3.1 Flash TTS 是 Google 文本转语音模型,生成更自然有表现力的 AI 语音;支持细粒度音频标签控制语音风格与节奏,70+ 语言,并带 SynthID 水印。
Lightning TTS v3 是 Smallest.ai 的低延迟多语言文字转语音 API,支持语音克隆,适用于语音代理与生产级音频;注册送 $10 免费额度。
Claude Voice Mode 让你通过语音与 Claude 交流并收听语音回复;同一对话中可在语音与文本间切换(测试版)。
使用 easyquran.ai 免费在线阅读古兰经,含音频诵读与翻译,并提供18种语言逐词解析,便于深入理解与学习。
Voxtral TTS 是 Mistral AI 的多语言文本转语音模型,面向低延迟自然语音生成,并支持可适配的说话人音色用于语音代理流程。
Clipchamp AI Voice Over Generator 在线文本转语音TTS工具,把文字快速生成逼真画外音并用于视频;支持多语言与语速情感调节。
LOVO 是 AI 配音生成与文字转语音工具,可生成 100+ 语言的拟真人声音,并提供在线视频编辑与字幕同步能力。
TADA(Text-Acoustic Dual Alignment)是 Hume AI 开源文本转语音模型,实现文本与音频一对一同步,提升语音生成速度与可靠性。
Ondoku 文字转语音(TTS)软件:粘贴文本选择语音即可朗读,并支持下载为 .mp3,提供多语言与多种语音选项。
Xeder 是一款 Chrome 扩展,可将你的 X(Twitter)动态逐条朗读为音频,边做事边收听更新。