Gemini 3.5 Live Translate 是 Google 的音訊模型,支援 70+ 種語言近即時語音互譯,適用於通話、會議、課程、直播與 Google 產品翻譯功能。
speech-core 是一款 C++17 本機端語音代理流程引擎,支援 VAD、串流與批次語音轉文字、說話人分離及文字轉語音,協助開發者在 Linux、Windows、Android 與 Apple 相關工作流程中建立本地語音應用,且無需雲端推論。
Krisp Voice Translation API 是即時語音轉語音翻譯 API,適用於通話與語音應用。支援 61 種語言任意配對、背景語音消除與自訂詞彙控制,協助開發者精準翻譯即時對話。
Vox 是一款適用於 Mac 與 Windows 的裝置端 AI 語音聽寫應用,將口說內容整理成可直接貼上的文字。支援本機處理、免註冊帳號,並可離線使用。
Wave 是原生 macOS 聽寫 app,可在游標處直接把語音轉成文字;支援本機 Whisper 離線隱私或 Groq 更快轉錄,免帳號、預設不依賴雲端。
LocalClicky 是一款在 macOS 上本機運作的語音助理,可離線轉錄語音、理解指令、查看螢幕並控制 Mac,且不會將資料傳送到雲端服務。
Clarafy 是一款瀏覽器寫作助手,可在你輸入的地方直接潤飾文字,支援改寫、語氣調整與語音聽寫,讓訊息與草稿更清楚,不必複製到其他應用程式。
Shadow 是一款 Mac app,可擷取你看到、聽到與說出的內容,並在這些情境上執行自訂 Skills。適合會議、語音輸入與螢幕資訊,快速產出筆記、回覆、摘要等內容。
AutoSubtitles 是一款瀏覽器版 AI 字幕產生器與字幕編輯器,無需安裝軟體即可為影片加上、樣式化並匯出字幕,支援多種格式與語言,提供免費起始方案,且無需帳號。
Trace 是一款 macOS 會議逐字稿應用,能在本機錄製麥克風與系統音訊,輸出帶時間戳記重點的 Markdown 逐字稿,適合不想上傳雲端、建立帳號或使用會議機器人的會議筆記需求。
Ringg Parrot STT V1 是一款 speech-to-text API,支援印地語、英語與混合語音的即時與檔案轉錄,適用於語音產品、AI agents 與聯絡中心的低延遲轉寫與 Python 整合。
TongueType 是一款 macOS 語音聽寫 app,使用 Whisper AI 在本機轉寫語音,並可在游標所在處直接插入文字。也支援音訊與影片檔轉錄,無雲端處理、帳號或訂閱。
Carbon Voice 是一款適合團隊的非同步語音訊息 app,整合人員與 AI agents,支援語音轉文字、語音或文字回覆,並可在桌面、手機、手錶與小工具使用。
SpeakMac 是 Mac 離線語音轉文字字典輸入工具,將即時口述轉成作用中視窗文字;支援 25+ 語言,買斷免訂閱。
SpeakON iPhone 語音輸入裝置:一鍵按住說話,將口述轉成精煉文字,直接送到你正在使用的輸入應用。
Harker 是 macOS 免費語音轉文字 App,使用全域快捷鍵即可在任何輸入位置直接口述成文字。可升級 Premium 加入 AI 文字樣式、校對與翻譯。
xAI 提供 Grok Speech to Text 與 Text to Speech API,支援低延遲 REST/WebSocket、25+ 語言、雙人聲分離與 TTS 語音標籤等功能。
Ghost Pepper 是 macOS 語音逐字稿與會議轉錄 App,可在 Apple Silicon 本機 100% 轉成文字,內容不送雲端。
doing for Mac:語音與截圖輸入,離線本地轉錄、無雲端上傳與無需帳號。一次性 $49 下載。
Walkie 是桌面語音轉文字工具,按熱鍵把口述內容插入任何 App。支援 Fast Mode 雲端轉寫與格式化,或 Local Mode 全離線。