Signal Recorder SR-7 是一款适用于 Mac 和 iPhone 的录音应用,可在设备本地转写音频,生成本地标题与摘要,并将录音导出为 Markdown 文件。适合追求离线优先工作流、可选 iCloud 同步且无订阅的用户。
speech-core 是一款基于 C++17 的端侧语音代理流水线引擎,支持 VAD、流式与批量语音转文字、说话人分离和文字转语音。帮助开发者在 Linux、Windows、Android 及 Apple 相关工作流中构建本地语音应用,无需云端推理。
Krisp Voice Translation API 是一款适用于实时通话和语音应用的语音转语音翻译 API,支持 61 种语言任意配对、背景人声消除和自定义词汇控制,助力开发者快速接入。
Vox 是一款适用于 Mac 和 Windows 的本地 AI 语音听写应用,可将口述内容整理成干净文本并复制到剪贴板。支持离线工作,无需账号注册。
Wave 是一款原生 macOS 语音听写应用,可在光标处将语音转成文字;支持本地 Whisper 离线隐私,或用 Groq 实现更快转录,无需账号或默认云端依赖。
Daisy 是一款适用于 Mac 的开源本地优先会议录音和语音转写应用。支持本地录音、离线转写,转录内容以 markdown 保存,并可通过本地 MCP 服务器供 Claude Desktop 或 Cursor 访问。
LocalClicky 是一款本地运行的 macOS 语音助手,可离线转录语音、解析指令、查看屏幕并控制 Mac,且不会将数据发送到云端,适合免手操作与本地处理用户。
Sun 是一款面向协作语音交互的实时 voice API,适用于应用和产品中的多用户实时语音体验,帮助开发者构建超越一对一聊天的交互场景。
Ringg Parrot STT V1 是一款语音转文字 API,支持印地语、英语和混合语音的实时及文件转写,适用于低延迟语音产品、AI agent 和呼叫中心工作流,提供 Python 集成路径。
TongueType 是一款 macOS 语音听写应用,使用 Whisper AI 本地转写语音,并在光标处直接插入文字;还支持音频和视频文件转写,无需云端处理、账号或订阅。
Carbon Voice 是面向团队的异步语音消息应用,把人和 AI agents 放在同一处。支持语音转文字更新,可用语音或文字回复,并可在桌面端、移动端、手表和小组件中使用。
Tico 是 Windows 上的 AI 助手:聆听你的语音提问,理解屏幕内容,并用语音给出分步指导,定位正确点击位置。
Snaply 在 Mac 上录制会议音频,通话结束后生成可编辑逐字稿、清晰摘要和行动项,转写与总结本地处理,保护隐私。
Memoket Gem 可穿戴录音对话,并将内容转为可用语境,配合“一按一次”采集流程,便于与 AI 工具协作。
使用 AssemblyAI Voice Agent API 流式传入音频并实时接收语音输出,配置逐字停顿、音频标签、说话人角色与代码切换等转写结构。
Ora 是 macOS 上的个人本地实时同传:语音翻译边说边流式显示部分字幕,音频不发送到外部服务器。可免费下载使用。
SpeakMac 是 Mac 离线语音转文字口述应用,将实时语音转成活动窗口文本,支持25+语言,一次性买断无订阅。
SpeakON iPhone语音输入设备:一键按下即可口述并把语音转换为应用内的润色文字,减少打字切换。
Harker 是 macOS 免费语音转文字应用,支持全局快捷键边用边写;升级 Premium 可用 AI 写作风格、格式、语法修正与翻译。
xAI 提供 Grok Speech to Text 与 Text to Speech APIs:低延迟 REST/WebSocket 转写与合成,多语言支持,含说话人分离与 TTS 语音标签。