OpenAI Realtime API 促進低延遲、多模態通訊,適用於建構語音代理等應用程式,支援語音到語音、音訊/圖像/文字輸入,以及音訊/文字輸出。
Zavi AI 是一款先進的語音輸入鍵盤,可即時將自然語音轉換為清晰、專業的文字,並自動移除贅詞和修正所有應用程式中的語法錯誤。
Dictato 是一款專為 Mac 設計的私密、裝置端聽寫應用程式,它使用 Whisper、Parakeet 或 Apple 引擎即時將語音轉換為文字,適用於所有應用程式。
Thinklet 是一款由 AI 驅動、以語音為先的筆記應用程式,可即時將口述想法轉錄為有條理的筆記,並允許使用者在裝置上本機與他們的知識庫進行聊天。
Willow Voice 是一款智慧型、具備情境感知能力的 AI 語音轉文字聽寫軟體,適用於 Mac、Windows 和 iOS,旨在透過即時將自然語音轉換為完美文字,從而提高生產力。
閃電說 AI 語音輸入法是一款端側優先的 AI 語音輸入工具,聲稱比傳統打字快4倍,並提供毫秒級響應和強大的 AI 智能糾錯功能,支持所有應用。
ClawdTalk 彌合了基於文字的機器人(例如使用 OpenClaw 建構的機器人)與現實世界語音通訊之間的差距,使用戶能夠像撥打電話一樣呼叫他們的機器人。
一個免費的線上工具,可將音訊和視訊檔案轉換為超過45種語言的準確文字記錄。它支援多種檔案格式,無需下載或註冊。
MiniCPM-o 4.5 是一款功能強大的多模態人工智慧模型,專為視覺、語音和全雙工實時串流而設計,提供先進的視覺理解、語音合成和即時互動能力,架構緊湊,擁有9B參數。它融合多個先進的AI組件,如 SigLip2、Whisper-medium、CosyVoice2 和 Qwen3-8B,實現多任務的最先進性能。其核心目標是讓強大的多模態AI技術更易於普及,提供一個多功能、高效且易於使用的模型,適用於研究、開發和實際應用部署。
Voxtral 是一個先進的語音轉文字平台,提供即時與批次轉錄,具有說話人辨識、多語言支持和低延遲,適用於企業和開發者。

您的個人 AI,能夠記住您所看到、所說和聽到的一切。免費、開源、100% 本地。

Voice Anywhere 是一款適用於 macOS 的即時聽寫工具,可以將您的語音即時轉換為文本,適用於任何應用程式。
Sayline 是最有效的輸入方式,使使用者能夠快速且高效地透過強大的 AI 語音辨識技術進行文本輸入。
TalkMirror 是一款專業的語音反饋工具,專為語言學習者、公共演講者和演員設計,通過語音反射提供即時自我修正。
Qlay 提供基於人工智慧的監考監督,確保評估過程的透明性。

透過 BlabbyAI 的 Chrome 擴展輕鬆將語音轉換為文本。
Poised 是一款由人工智慧驅動的溝通教練,提供即時反饋,幫助您在通話中自信地表達。
由人工智慧驅動的轉錄服務,將音頻和視頻文件轉換為文本。
AIMIX智剪是一款智能視頻編輯軟體,能夠快速批量製作原創短視頻,利用人工智慧實現自動生成字幕和語音合成等功能。
AssemblyAI 提供行業領先的語音 AI 模型,用於將語音轉錄為文本並從語音數據中提取洞察。