Vox 是什麼?
Vox 是一款適用於 Mac 與 Windows 的裝置端 AI 聽寫應用。你只要按住熱鍵、自然說話,就能把整理過的文字從剪貼簿貼上,且不會把音訊或逐字稿傳送到雲端服務。
這款應用是為了快速輸入文字、盡量減少設定而打造:內建預設熱鍵、使用本機轉錄與整理模型,初次下載模型後也能離線運作。Vox 也會依照你正在輸入的應用程式調整輸出風格,提供一般寫作、電子郵件、聊天、程式碼註解和筆記等模式。
主要功能
- 裝置端轉錄與整理,讓聽寫在本機處理,而不是透過雲端往返。
- 支援 Mac 與 Windows,並提供各平台專用熱鍵。
- 以剪貼簿為核心的流程:按住快捷鍵、說話、放開,然後把整理後的文字貼到想要的位置。
- 依應用程式調整的語音模式,可切換一般文字、電子郵件、聊天、程式碼註解、筆記或自訂模式的格式。
- 使用不需要帳號,且依產品頁所述不會收集聽寫遙測資料。
- 第一次下載模型後即可離線使用。
如何使用 Vox
先為你的平台安裝應用程式,然後使用預設熱鍵開始聽寫。在 Mac 上,快捷鍵是 ⌘⌥.;在 Windows 上,則是 Ctrl+Alt+.。
Vox 會在你說話時持續聆聽,正常說完後放開熱鍵即可停止。應用程式會把整理好的文字放到剪貼簿,接著你只要用一般貼上指令貼到目標應用程式即可。
使用情境
- 透過口述草稿來更快撰寫電子郵件,並讓 Vox 將其整理成完整信件內容。
- 在 Slack、Discord 或 iMessage 中傳送較短的聊天訊息,並使用更口語、精簡的輸出風格。
- 聽寫程式碼註解或其他開發者筆記,同時保留識別名稱並使用現在式語氣。
- 以更乾淨、結構更清楚的形式記錄會議筆記、待辦清單或腦力激盪內容。
- 在初次下載模型後,於離線或連線受限的環境中使用聽寫功能。
FAQ
Vox 需要帳號嗎? 個人使用不需要帳號。頁面註明商業授權則透過 Stripe 另行處理。
Vox 會把音訊或逐字稿送到雲端嗎? 不會。產品頁表示音訊、逐字稿和當機報告都不會離開你的電腦。
Vox 可以在沒有網路的情況下使用嗎? 可以,在首次執行時完成一次性模型下載後即可。頁面表示之後便可在沒有網路的情況下運作。
Vox 支援哪些平台? Vox 可用於 Mac 和 Windows。頁面列出支援運行 macOS 14+ 的 Apple Silicon Mac 與 Windows 10/11 x64。
替代方案
- 依賴雲端處理的傳統桌面聽寫工具:如果你想要語音轉文字,這些工具可能更容易比較,但通常會使用線上往返,而不是本機處理。
- 作業系統內建語音輸入:通常更簡單,且已預先安裝,但可能沒有相同的應用程式專屬整理模式或以剪貼簿為核心的流程。
- 具備語音輸入的一般 AI 寫作工具:這些工具有助於重寫與起草,但通常以編輯器或聊天介面為核心,而不是系統層級的聽寫。
- 手動輸入:仍是精準編修的備案,但無法提供 Vox 旨在帶來的速度優勢。
替代品
Speech to Text Converter Online
一個免費的線上工具,可將音訊和視訊檔案轉換為超過45種語言的準確文字記錄。它支援多種檔案格式,無需下載或註冊。
Dictato
Dictato 是 macOS 離線語音轉文字工具,將轉寫即時插入你正在輸入的任何 App;支援 Whisper、Parakeet 與 Apple 引擎。
Ringg Parrot STT V1
Ringg Parrot STT V1 是一款 speech-to-text API,支援印地語、英語與混合語音的即時與檔案轉錄,適用於語音產品、AI agents 與聯絡中心的低延遲轉寫與 Python 整合。
Sanota
Sanota 將你的語音轉成清晰又好看的文字,輕鬆記下回憶與靈感,免從空白頁開始;可免費開始。
Carbon Voice
Carbon Voice 是一款適合團隊的非同步語音訊息 app,整合人員與 AI agents,支援語音轉文字、語音或文字回覆,並可在桌面、手機、手錶與小工具使用。
OpenAI Realtime API
使用 OpenAI Realtime API 建立低延遲、多模態語音與即時音訊體驗,支援瀏覽器語音代理與 WebSocket 即時轉錄。