Ghost Pepper 是什么?
Ghost Pepper 是一款 macOS 语音听写与会议转录应用,可将语音转为文本,并在本地机器上捕获通话记录。它专为希望使用语音转文本工作流(听写、通话笔记和转录)的用户设计,无需将音频发送至云服务。
该应用 100% 本地运行,使用 Apple Silicon (M1+) 上的设备模型,输出转录和摘要并保存为本地文件。该项目免费开源,采用 MIT 许可证。
主要功能
- 按压说话的语音听写: 按住 Control 键说话,松开即转录,并将结果粘贴至任意文本字段。
- 保存为本地 Markdown 的会议转录: 通话录音可生成笔记、转录和 AI 摘要,保存为本地 Markdown 文件。
- 设备端语音清理: 本地 LLM 执行清理,如移除填充词、修正自我更正并优化语音。
- Mac 上 100% 本地执行: 核心功能通过 Apple Silicon 在设备端运行;无任何上传、追踪或云端存储。
- 多种语音转文本模型选项: 使用本地 ASR 模型,如 Whisper (tiny.en, small.en) 和 Parakeet v3,具有不同的语言覆盖和性能权衡。
- 本地隐私验证且无遥测: 网站描述了“隐私审计”,通过 AI 代码审查检查核心功能,并声明无分析/遥测 SDK。
如何使用 Ghost Pepper
- 下载并安装: 下载
GhostPepper.dmg文件,将 Ghost Pepper 拖入 Applications 文件夹。 - 授予权限: 提示时,在 macOS 中允许 Microphone 和 Accessibility 权限。
- 配置输入/触发: 使用内置 Control 键行为——按住 Control 说话,松开转录。
- 用于会议: 会议转录时,录制通话并生成转录输出;应用将结果(转录/笔记/摘要)保存为本地 Markdown。
- 如果 macOS 阻止应用: 若看到“Apple 无法验证”警告,请前往 System Settings > Privacy & Security 并选择 Open Anyway 一次。
使用场景
- 免提文档编辑: 使用按压说话将句子听写至邮件、文档或笔记,并将转录粘贴至文本字段。
- 从语音进行个人学习或头脑风暴: 语音清理移除填充词并修正自我编辑后,将口述想法捕获为优化文本。
- 团队会议文档(离线工作流): 录制会议并生成笔记、转录和摘要,保存为 Mac 上的 Markdown。
- 特定语言转录需求: 根据需要仅英语输出(例如 Whisper tiny.en 或 small.en)或更广语言覆盖(例如 Parakeet v3、Qwen ASR 变体)选择语音转文本模型。
- 注重隐私的转录: 当不希望音频或转录输入离开设备时,使用纯本地处理。
常见问题
-
Ghost Pepper 需要用户账户吗?
根据页面,无需账户。 -
音频会发送至云端吗?
网站声明所有模型在 Mac 上运行,无任何上传、追踪或云端存储。 -
需要什么硬件?
下载信息指定 macOS 14.0+ 和 Apple Silicon (M1+)。 -
如何开始听写?
按住 Control 说话,松开转录并将文本粘贴至目标字段。 -
会议输出存储在哪里?
页面声明会议转录/笔记/摘要保存为本地 Markdown 文件。
替代方案
- macOS 本地语音转文本应用: 其他强调设备端/离线处理的桌面听写和转录工具,通常适用于类似按压说话或转录工作流。
- 云转录服务(非本地): 基于 Web 或 API 的转录解决方案,可能提供更广语言/模型选项,但通常需将音频发送至提供商,与 Ghost Pepper 的纯本地方式形成对比。
- 通用离线转录 + 文本清理工具: 专注于转录 (ASR) 和独立文本编辑/清理步骤的工具,可组合成类似于 Ghost Pepper 听写 + 清理 + 本地保存转录的工作流。
替代品
Speech to Text Converter Online
一个免费的在线工具,可将音频和视频文件转换为45种以上语言的准确文本记录。它支持多种文件格式,无需下载或注册。
Dictato
Dictato 是 macOS 离线语音转文字应用:支持 Whisper、Parakeet 与 Apple 引擎,不走云端并无超时,将文字插入任意输入框。
Memo AI
由人工智能驱动的转录服务,将音频和视频文件转换为文本。
Sanota
Sanota 把你的声音转成清晰优美的文字,轻松记录回忆与灵感,把想法整理成可阅读内容,支持免费开始。
OpenAI Realtime API
使用 OpenAI Realtime API 构建低延迟、多模态语音与实时音频体验,支持浏览器语音代理与 WebSocket 实时转录。
Pewbeam
Pewbeam 实时聆听讲道并自动识别圣经经文,瞬间投屏显示,帮助牧师与投影团队无需输入即可保持流程顺畅。