Ghost Pepper 是什麼?
Ghost Pepper 是 macOS 語音逐字稿與會議轉錄 App,可在本機將語音轉成文字並擷取通話逐字稿。它專為希望使用語音轉文字工作流程(逐字稿、通話筆記與逐字稿)的使用者設計,且無需將音訊傳送至雲端服務。
App 使用 Apple Silicon (M1+) 的本機模型 100% 本機執行,並將逐字稿與摘要輸出為本機檔案儲存。專案為免費開源,採用 MIT 授權。
主要功能
- 按鍵語音輸入工作流程: 按住 Control 說話,放開即轉錄,並將結果貼上至任何文字欄位。
- 會議轉錄儲存為本機 Markdown: 通話錄音可產生筆記、逐字稿與 AI 生成摘要,儲存為本機 markdown 檔案。
- 本機語音清理: 本機 LLM 執行清理,例如移除填充詞、修正自我更正,並清理語音。
- Mac 上 100% 本機執行: 核心功能經 Apple Silicon 本機執行;無任何上傳、追蹤或雲端儲存。
- 多種語音轉文字模型選項: 使用本機 ASR 模型如 Whisper (tiny.en, small.en) 與 Parakeet v3,具有不同語言涵蓋與效能權衡。
- 本機隱私驗證與無遙測: 網站描述「隱私審核」,經 AI 程式碼審查核心功能,並確認無分析/遙測 SDK。
如何使用 Ghost Pepper
- 下載與安裝: 下載
GhostPepper.dmg檔案,並將 Ghost Pepper 拖曳至 Applications 資料夾。 - 授權權限: 出現提示時,允許 macOS 的 Microphone 與 Accessibility 權限。
- 設定輸入/觸發: 使用內建 Control 鍵行為—按住 Control 說話,放開即轉錄。
- 用於會議: 會議轉錄時,錄製通話並產生逐字稿輸出;App 將結果(逐字稿/筆記/摘要)儲存為本機 markdown。
- 若 macOS 封鎖 App: 若見「Apple 無法驗證」警告,請前往 System Settings > Privacy & Security 並選擇 Open Anyway 一次。
使用情境
- 免持文件編輯: 使用按鍵語音輸入將句子口述至電子郵件、文件或筆記,並將轉錄貼上至文字欄位。
- 個人學習或腦storm 語音擷取: 語音清理移除填充詞並修正自我編輯後,將口述想法擷取為清理文字。
- 團隊會議記錄(離線工作流程): 錄製會議並產生筆記、逐字稿與摘要,儲存為 Mac 上 markdown。
- 語言特定轉錄需求: 依需求選擇語音轉文字模型,例如僅英文輸出(Whisper tiny.en 或 small.en)或更廣語言涵蓋(Parakeet v3、Qwen ASR 變體)。
- 注重隱私轉錄: 當不希望音訊或轉錄輸入離開裝置時,使用僅本機處理。
常見問題
-
Ghost Pepper 需要使用者帳戶嗎?
頁面表示無需帳戶。 -
音訊會傳送至雲端嗎?
網站表示所有模型在本機 Mac 執行,無任何上傳、追蹤或雲端儲存。 -
需要何種硬體?
下載資訊指定 macOS 14.0+ 與 Apple Silicon (M1+)。 -
如何開始口述?
按住 Control 說話,放開即轉錄並將文字貼上至目標欄位。 -
會議輸出儲存何處?
頁面表示會議逐字稿/筆記/摘要儲存為本機 markdown 檔案。
替代方案
- macOS 本機語音轉文字 App: 其他強調本機/離線處理的桌面口述與轉錄工具,通常適用類似按鍵語音輸入或轉錄工作流程。
- 雲端轉錄服務(非本機): 網頁或 API 驅動轉錄方案,可能提供更廣語言/模型選項,但通常需將音訊傳送至提供者,與 Ghost Pepper 的僅本機方式相反。
- 通用離線轉錄 + 文字清理工具: 專注轉錄 (ASR) 與獨立文字編輯/清理步驟的工具,可結合為類似 Ghost Pepper 的口述 + 清理 + 本機儲存逐字稿工作流程。
替代品
Speech to Text Converter Online
一個免費的線上工具,可將音訊和視訊檔案轉換為超過45種語言的準確文字記錄。它支援多種檔案格式,無需下載或註冊。
Dictato
Dictato 是 macOS 離線語音轉文字工具,將轉寫即時插入你正在輸入的任何 App;支援 Whisper、Parakeet 與 Apple 引擎。
Memo AI
由人工智慧驅動的轉錄服務,將音頻和視頻文件轉換為文本。
Sanota
Sanota 將你的語音轉成清晰又好看的文字,輕鬆記下回憶與靈感,免從空白頁開始;可免費開始。
OpenAI Realtime API
使用 OpenAI Realtime API 建立低延遲、多模態語音與即時音訊體驗,支援瀏覽器語音代理與 WebSocket 即時轉錄。
Pewbeam
Pewbeam 會即時聆聽講道內容,自動辨識聖經經文並立刻顯示在螢幕上,協助牧師與投影團隊無需輸入點擊。