在设备本地录制通话和环境声音
在 Mac 上可分别捕获麦克风输入和系统音频,从而无需会议机器人即可录制通话双方。
Synopsule 是一款适用于 Mac 和 iPhone 的应用,可在您的设备上录制、转写并可选地摘要对话。它旨在生成带说话人标记的可读会议记录,保留完整音频以便回放,并提供可在应用外使用的开放文本文件。
该产品强调本地处理:转写在设备上运行,原始音频默认本地存储并在最终处理后删除,摘要功能为可选。在 Mac 上,它可以分别捕获麦克风输入和系统音频;在 iPhone 上,它通过麦克风录制房间中的内容,适用于访谈、讲座、语音备忘录和类似对话。
在 Mac 上可分别捕获麦克风输入和系统音频,从而无需会议机器人即可录制通话双方。
Whisper 转写完全在您的设备上运行,应用内附带一个模型,并可下载更大的模型。
分离不同声音、标记说话人,并在设备上识别回访声音,让姓名可跨录音保留。
将完整音频保留在设备上,方便您从转录稿中回放任意时刻,而不是丢弃源录音。
可选择在设备上创建摘要,使用 Apple Intelligence 或您自己的密钥,并且仅在请求摘要时发送转录文本。
可导出为 Word、PDF、Markdown、HTML、SRT 和 VTT,并可一键分享至 Obsidian 或 Apple Notes。
在 Mac 上录制 Zoom、Meet 或 Teams 通话,分别捕获麦克风和系统音频,并在原始音频仍可用的情况下查看带标记的转录稿。
使用 iPhone 录制访谈、讲座、走廊对话或语音备忘录,然后保留带时间锚点的可搜索转录稿和标记。
将常用说话人保存一次,以便在同一设备上的后续录音中识别,减少未来转录稿中的手动整理。
将转录稿导出为适合后续编辑或文档工作流的格式,包括 Markdown、Word、PDF、HTML、SRT、VTT、Obsidian 和 Apple Notes。
它会在您的 Mac 或 iPhone 上录制对话,在设备本地转写,并且可以在不将音频发出设备的情况下创建可选摘要。
Synopsule 支持 Mac 和 iPhone。页面说明一次性购买 $1.99 可覆盖这两台设备。
核心流程不需要账户,且转写从首次启动起就可离线使用。
导出格式包括 Word、PDF、Markdown、HTML、SRT 和 VTT,应用还可以分享至 Obsidian 或 Apple Notes。
Tactiq is an AI note taker for Google Meet, Zoom, and Microsoft Teams that transcribes meetings live and turns them into summaries, action items, and follow-up outputs. It is built around a Chrome extension and supports team workflows through sharing and integrations.
Scripta is a privacy-first AI notetaker that records, transcribes, and summarizes meetings directly on your device. The public site currently shows a Mac beta download and a Windows waitlist.
Speech to Text Converter is a browser-based transcription tool for live dictation and uploaded audio or video files. It offers a free tier for short tasks and a Pro plan for unlimited transcription, AI summaries, translation, speaker identification, and advanced exports.
Sanota is an app that turns spoken memories, reflections, and interviews into clear written stories. It supports personal storytelling, family history, and shared memories, with guided prompts and subscription pricing.
Carbon Voice is an asynchronous voice messaging app for teams and individuals, with transcripts, AI catch-up, and cross-device access. It helps people and agents communicate without needing a live call.
An OpenAI API guide for choosing the right speech architecture for live audio, translation, transcription, speech generation, and audio-capable chat. It helps developers map each speech application to the appropriate session type, endpoint, and connection method.