什麼是 TongueType?
TongueType 是一款 macOS 語音聽寫 app,讓使用者按住熱鍵、說話,再放開即可將轉寫文字插入游標所在位置。它在 Apple Silicon Mac 上本機執行 Whisper AI,因此轉寫是在裝置上完成,而非雲端。
這款 app 旨在讓使用者快速、免手操作地輸入文字,適用於電子郵件、聊天、筆記、提示詞和程式碼註解等情境。它也支援從音訊與影片檔轉錄,方便將錄音內容轉成文字,無需上傳檔案到外部服務。
主要功能
- 在 Apple Silicon Mac 上使用 Whisper AI 進行本機轉寫,音訊會留在裝置上。
- 按住說話的聽寫流程:按住熱鍵、說話,然後放開,即可將文字插入游標所在處。
- 支援 12 種語言,並具備自動語言偵測。
- 支援 WAV、MP3、MP4 和 MOV 檔案轉錄,讓 app 不只限於即時聽寫。
- 選單列 app 設計,沒有 Dock 圖示或主視窗,方便隨時使用且不占用工作空間。
- 可自訂熱鍵、啟動寬限時間、雙擊鎖定模式、浮層外觀與插入行為。
- 提供後處理規則,可移除如 [music] 或 (laughter) 等註記、用口語指令取消聽寫,並將「new line」或「question mark」等口語提示對應為標點或換行。
- 使用 iCloud 同步跨 Mac 的設定,讓偏好設定可在裝置間跟隨使用者。
如何使用 TongueType
在相容的 Mac 上安裝 app,然後設定或沿用預設熱鍵。需要聽寫時,按住按鍵、自然說話,再放開,即可把轉寫內容插入目前 app 的游標位置。
若是錄音內容,只要將支援的音訊或影片檔拖曳到 TongueType,就會在本機進行轉錄。使用者也可以先調整語言行為、外觀與文字清理設定,再開始日常使用。
使用情境
- 比打字更快地撰寫電子郵件或 Slack 訊息,尤其是在想用說的、而不是切換情境去打字時。
- 直接在編輯器中撰寫程式碼註解、提示詞或簡短技術筆記。
- 轉錄儲存為 WAV、MP3、MP4 或 MOV 檔案的會議錄音、訪談或語音備忘錄。
- 在重視隱私的工作流程中使用聽寫,讓音訊保留在 Mac 上。
- 協助覺得鍵盤輸入痛苦、緩慢或不實際,並需要以語音作為替代輸入方式的使用者。
常見問題
TongueType 是雲端服務嗎?
不是。來源說明轉寫是在 Mac 上以 Whisper AI 本機執行,音訊不會離開裝置。
TongueType 支援即時聽寫和檔案轉錄嗎?
有。它同時支援即時按住說話的聽寫,以及支援的音訊與影片檔轉錄。
支援哪些語言?
頁面表示 TongueType 支援 12 種語言並包含自動偵測,但除了如英文、西班牙文、法文、德文、日文、中文和韓文等範例外,未提供完整語言清單。
有免費版本嗎?
有。頁面說明免費版本包含所有功能,每月提供 30 分鐘即時聽寫,且檔案轉錄僅限每個檔案的前 10 秒。
它可運行在哪個平台?
TongueType 適用於 Apple Silicon Mac 的 macOS 14 以上版本。
替代方案
- 內建 macOS 聽寫:適合基本語音轉文字的較簡單系統級選項,但看起來不具備這裡描述的本機 Whisper 工作流程或相同的自訂功能。
- 雲端聽寫 app:可能提供跨平台存取或帳號式同步,但通常會將音訊經由外部服務處理,而非完全保留在本機。
- 一般轉錄工具:如果主要需求是把錄音轉成文字,這類 app 會很適合,但可能不會特別針對即時插入目前作用中 app 的流程做最佳化。
- 語音輸入擴充功能或輔助工具:可幫助需要以語音作為替代輸入方式的使用者,但其重點可能在不同工作流程,例如系統層級控制、輔助功能或筆記,而非以熱鍵驅動的聽寫。
替代品
Speech to Text Converter Online
一個免費的線上工具,可將音訊和視訊檔案轉換為超過45種語言的準確文字記錄。它支援多種檔案格式,無需下載或註冊。
Dictato
Dictato 是 macOS 離線語音轉文字工具,將轉寫即時插入你正在輸入的任何 App;支援 Whisper、Parakeet 與 Apple 引擎。
Ringg Parrot STT V1
Ringg Parrot STT V1 是一款 speech-to-text API,支援印地語、英語與混合語音的即時與檔案轉錄,適用於語音產品、AI agents 與聯絡中心的低延遲轉寫與 Python 整合。
Sanota
Sanota 將你的語音轉成清晰又好看的文字,輕鬆記下回憶與靈感,免從空白頁開始;可免費開始。
Carbon Voice
Carbon Voice 是一款適合團隊的非同步語音訊息 app,整合人員與 AI agents,支援語音轉文字、語音或文字回覆,並可在桌面、手機、手錶與小工具使用。
OpenAI Realtime API
使用 OpenAI Realtime API 建立低延遲、多模態語音與即時音訊體驗,支援瀏覽器語音代理與 WebSocket 即時轉錄。