TongueType 是什么?
TongueType 是一款 macOS 语音听写应用,用户按住热键、说话并松开后,即可将转写文本插入光标位置。它在 Apple Silicon Mac 上本地运行 Whisper AI,因此转写在设备端完成,而不是在云端。
该应用适合在邮件、聊天、笔记、提示词和代码注释等场景中快速免手输入。它还支持从音频和视频文件转写,方便将录音内容转换为文本,而无需上传到外部服务。
主要功能
- 使用 Whisper AI 在 Apple Silicon Mac 上本地转写,音频始终留在设备上。
- 按住说话的听写流程:按住热键、说话,然后松开,将文本插入光标所在位置。
- 支持 12 种语言,并可自动检测语言。
- 支持 WAV、MP3、MP4 和 MOV 文件转写,将应用扩展到实时听写之外。
- 菜单栏应用设计,没有 Dock 图标或主窗口,方便使用且不占用工作区。
- 可自定义热键、激活宽限期、双击锁定模式、浮层外观和插入行为。
- 后处理规则可移除如 [music] 或 (laughter) 之类的注释,使用语音短语取消听写,并映射“new line”或“question mark”等口头提示。
- 通过 iCloud 在多台 Mac 之间同步设置,偏好可随用户在设备间保持一致。
如何使用 TongueType
在兼容的 Mac 上安装应用,然后设置或保留默认热键。需要听写时,按住按键,自然说话,松开后,转写内容会插入到当前应用的光标位置。
对于录音,直接将支持的音频或视频文件拖入 TongueType,即可让它在本地转写内容。用户也可以先调整语言行为、外观和文本清理相关设置,再日常使用。
使用场景
- 比打字更快地撰写邮件或 Slack 消息,尤其适合想直接说话而不是切换上下文输入的用户。
- 直接在编辑器中起草代码注释、提示词或简短技术笔记。
- 转写存储为 WAV、MP3、MP4 或 MOV 文件的会议录音、访谈或语音备忘录。
- 在注重隐私的工作流程中使用听写,确保音频始终留在 Mac 上。
- 帮助觉得键盘输入痛苦、缓慢或不方便的用户,将语音作为替代输入方式。
常见问题
TongueType 是云端服务吗?
不是。源文说明转写在 Mac 本地通过 Whisper AI 运行,音频不会离开设备。
TongueType 支持实时听写和文件转写吗?
支持。它既支持实时按住说话听写,也支持对受支持的音频和视频文件进行转写。
支持哪些语言?
页面说明 TongueType 支持 12 种语言并包含自动检测,但除英语、西班牙语、法语、德语、日语、中文和韩语等示例外,并未提供完整语言列表。
有免费版本吗?
有。页面说明免费版包含全部功能,每月提供 30 分钟实时听写,文件转写仅限每个文件的前 10 秒。
它运行在哪个平台上?
TongueType 适用于 Apple Silicon Mac 上的 macOS 14+。
替代方案
- macOS 内置听写:适合基础语音转文字的更简单系统级选项,但似乎不具备此处所述的本地 Whisper 工作流或相同的自定义能力。
- 云端听写应用:这类应用可能支持跨平台访问或基于账号的同步,但通常会将音频经由外部服务处理,而不是完全本地转写。
- 通用转写工具:如果主要需求是把录音转换为文字,这类应用可能适合,但未必针对将内容即时插入当前活动应用进行优化。
- 语音输入扩展或辅助功能工具:适合需要语音作为替代输入方式的用户,不过它们可能更强调系统级控制、辅助功能或笔记记录等不同工作流,而非基于热键的听写。
替代品
Speech to Text Converter Online
一个免费的在线工具,可将音频和视频文件转换为45种以上语言的准确文本记录。它支持多种文件格式,无需下载或注册。
Dictato
Dictato 是 macOS 离线语音转文字应用:支持 Whisper、Parakeet 与 Apple 引擎,不走云端并无超时,将文字插入任意输入框。
Ringg Parrot STT V1
Ringg Parrot STT V1 是一款语音转文字 API,支持印地语、英语和混合语音的实时及文件转写,适用于低延迟语音产品、AI agent 和呼叫中心工作流,提供 Python 集成路径。
Sanota
Sanota 把你的声音转成清晰优美的文字,轻松记录回忆与灵感,把想法整理成可阅读内容,支持免费开始。
Carbon Voice
Carbon Voice 是面向团队的异步语音消息应用,把人和 AI agents 放在同一处。支持语音转文字更新,可用语音或文字回复,并可在桌面端、移动端、手表和小组件中使用。
OpenAI Realtime API
使用 OpenAI Realtime API 构建低延迟、多模态语音与实时音频体验,支持浏览器语音代理与 WebSocket 实时转录。