在裝置上錄製通話與現場對話
擷取麥克風輸入,且在 Mac 上可將系統音訊分開錄製,因此能在沒有會議機器人的情況下錄下通話雙方內容。
Synopsule 是一款 Mac 與 iPhone 應用,可在你的裝置上錄音、轉錄,並可選擇性地摘要對話。它旨在產生帶有說話者標示、可讀性高的會議筆記,保留完整音訊以供回放,並提供可在應用程式外使用的開放文字檔。
這項產品強調本機處理:轉錄在裝置上執行,原始音訊會本機儲存,且預設在完成後刪除,摘要功能則為選用。Mac 版可分別擷取麥克風輸入與系統音訊;iPhone 版則透過麥克風錄下現場聲音,適合訪談、講座、語音備忘錄與類似對話。
擷取麥克風輸入,且在 Mac 上可將系統音訊分開錄製,因此能在沒有會議機器人的情況下錄下通話雙方內容。
將 Whisper 轉錄完全在你的裝置上執行,應用程式內含一個模型,並可下載更大的模型。
在裝置上分離聲音、標示說話者,並辨識再次出現的聲音,讓名稱可跨錄音延續。
將完整音訊保留在裝置上,讓你可以從逐字稿回放任何片段,而不是丟棄來源錄音。
在裝置上建立可選摘要,使用 Apple Intelligence 或你自己的金鑰,且只有在要求摘要時才會傳送逐字稿文字。
可匯出為 Word、PDF、Markdown、HTML、SRT 與 VTT,並可一鍵分享至 Obsidian 或 Apple Notes。
在 Mac 上錄製 Zoom、Meet 或 Teams 通話,分開擷取麥克風與系統音訊,並在原始音訊仍可用的情況下檢視帶有標示的逐字稿。
使用 iPhone 錄製訪談、講座、走廊談話或語音備忘錄,然後保留可搜尋的逐字稿,以及帶有時間標記的筆記與旗標。
將常見說話者儲存一次,讓它們之後可在同一裝置上的後續錄音中被辨識,減少未來逐字稿的手動整理。
將逐字稿匯出成適合後續編輯或文件工作流程的格式,包括 Markdown、Word、PDF、HTML、SRT、VTT、Obsidian 與 Apple Notes。
它會在你的 Mac 或 iPhone 上錄製對話、在裝置上轉錄,並可建立可選摘要,而不會將音訊送出裝置。
Synopsule 支援 Mac 與 iPhone。頁面說一次性購買 $1.99 即可涵蓋這兩種裝置。
核心流程不需要帳號,而且轉錄可從首次啟動開始離線運作。
可匯出 Word、PDF、Markdown、HTML、SRT 與 VTT,應用程式也可分享至 Obsidian 或 Apple Notes。
Tactiq is an AI note taker for Google Meet, Zoom, and Microsoft Teams that transcribes meetings live and turns them into summaries, action items, and follow-up outputs. It is built around a Chrome extension and supports team workflows through sharing and integrations.
Scripta is a privacy-first AI notetaker that records, transcribes, and summarizes meetings directly on your device. The public site currently shows a Mac beta download and a Windows waitlist.
Speech to Text Converter is a browser-based transcription tool for live dictation and uploaded audio or video files. It offers a free tier for short tasks and a Pro plan for unlimited transcription, AI summaries, translation, speaker identification, and advanced exports.
Sanota is an app that turns spoken memories, reflections, and interviews into clear written stories. It supports personal storytelling, family history, and shared memories, with guided prompts and subscription pricing.
Carbon Voice is an asynchronous voice messaging app for teams and individuals, with transcripts, AI catch-up, and cross-device access. It helps people and agents communicate without needing a live call.
An OpenAI API guide for choosing the right speech architecture for live audio, translation, transcription, speech generation, and audio-capable chat. It helps developers map each speech application to the appropriate session type, endpoint, and connection method.