Gemini 3.5 Live Translate 是 Google 的音频模型,可在 70+ 种语言间实现近乎实时的语音到语音翻译,适用于通话、会议、课程、直播及 Google 产品中的翻译功能。
speech-core 是一款基于 C++17 的端侧语音代理流水线引擎,支持 VAD、流式与批量语音转文字、说话人分离和文字转语音。帮助开发者在 Linux、Windows、Android 及 Apple 相关工作流中构建本地语音应用,无需云端推理。
Krisp Voice Translation API 是一款适用于实时通话和语音应用的语音转语音翻译 API,支持 61 种语言任意配对、背景人声消除和自定义词汇控制,助力开发者快速接入。
Vox 是一款适用于 Mac 和 Windows 的本地 AI 语音听写应用,可将口述内容整理成干净文本并复制到剪贴板。支持离线工作,无需账号注册。
Wave 是一款原生 macOS 语音听写应用,可在光标处将语音转成文字;支持本地 Whisper 离线隐私,或用 Groq 实现更快转录,无需账号或默认云端依赖。
LocalClicky 是一款本地运行的 macOS 语音助手,可离线转录语音、解析指令、查看屏幕并控制 Mac,且不会将数据发送到云端,适合免手操作与本地处理用户。
Clarafy 是一款浏览器写作助手,可在你输入处直接润色文本,支持改写、语气调整和语音听写,帮助你无需复制到其他应用即可整理更清晰的消息和草稿。
Shadow 是一款 Mac 应用,可捕捉你看到、听到和说到的内容,并在这些上下文上运行自定义 Skills,帮助将会议、语音输入和屏幕信息转为笔记、回复、摘要等输出。
AutoSubtitles 是一款基于浏览器的 AI 字幕生成器和字幕编辑器,可快速为视频添加、样式化并导出字幕,无需安装软件。支持多种格式和语言,免费起步,无需账号。
Trace 是一款 macOS 会议转写应用,可在本地录制麦克风和系统音频,生成带时间戳关键时刻的 Markdown 记录,适合不想上传云端、无需账号或会议机器人就能获取会议纪要的用户。
Ringg Parrot STT V1 是一款语音转文字 API,支持印地语、英语和混合语音的实时及文件转写,适用于低延迟语音产品、AI agent 和呼叫中心工作流,提供 Python 集成路径。
TongueType 是一款 macOS 语音听写应用,使用 Whisper AI 本地转写语音,并在光标处直接插入文字;还支持音频和视频文件转写,无需云端处理、账号或订阅。
Carbon Voice 是面向团队的异步语音消息应用,把人和 AI agents 放在同一处。支持语音转文字更新,可用语音或文字回复,并可在桌面端、移动端、手表和小组件中使用。
SpeakMac 是 Mac 离线语音转文字口述应用,将实时语音转成活动窗口文本,支持25+语言,一次性买断无订阅。
SpeakON iPhone语音输入设备:一键按下即可口述并把语音转换为应用内的润色文字,减少打字切换。
Harker 是 macOS 免费语音转文字应用,支持全局快捷键边用边写;升级 Premium 可用 AI 写作风格、格式、语法修正与翻译。
xAI 提供 Grok Speech to Text 与 Text to Speech APIs:低延迟 REST/WebSocket 转写与合成,多语言支持,含说话人分离与 TTS 语音标签。
Ghost Pepper 是 macOS 语音听写与会议转录应用,100% 本地运行在 Apple Silicon,无需上传云端即可将语音转文字。
doing 是适用于 Mac 的语音与截图输入工具,支持端侧转写,无需上传云端与账号;一次性下载 $49。
Walkie 桌面语音转文字应用:按热键将语音实时插入任意应用;Fast Mode 云端转写并格式化,Local Mode 完全本地离线转写。