Signal Recorder SR-7は、MacとiPhone向けのボイスレコーダーアプリです。音声を端末内で文字起こしし、ローカルでタイトルと要約を生成、録音をMarkdownファイルとして書き出せます。オフライン中心の録音環境を求める方に最適で、iCloud同期も選べます。
speech-core は、VAD、ストリーミング/バッチ音声認識、話者分離、音声合成に対応した、C++17 のオンデバイス音声エージェント向けパイプラインエンジン。Linux、Windows、Android、Apple系ワークフローでクラウド推論なしにローカル音声アプリを構築できます。
Krisp Voice Translation API は、ライブ通話や音声アプリ向けのリアルタイム音声翻訳 API です。61言語の相互翻訳、背景音声キャンセル、カスタム語彙制御に対応しています。
Voxは、MacとWindows向けのオンデバイスAI音声入力アプリです。話した内容をクリップボード用の整ったテキストに変換し、アカウント不要でオフラインでも使えます。
Waveは、カーソル位置に音声をテキスト化するmacOS向けのネイティブ書き起こしアプリ。ローカルWhisperでオフラインのプライバシー重視、またはGroqで高速変換も可能。
Daisyは、Mac向けのオープンソース・ローカルファーストな会議録音/文字起こしアプリです。音声を端末内で録音し、ローカルで書き起こしてMarkdownで保存。Claude DesktopやCursorにもローカルMCPサーバーで連携できます。
LocalClickyは、ローカルで動作するmacOS向け音声アシスタント。音声の文字起こし、コマンドの推論、画面確認、Mac操作をクラウド送信なしで行い、ハンズフリーのオフライン操作に対応します。
Sunは、アプリやプロダクト向けの共同音声インタラクションに対応したリアルタイム音声APIです。1対1を超えるライブ音声体験を求める開発者向け。
Ringg Parrot STT V1は、ヒンディー語・英語・コードミックス音声のリアルタイム/ファイル文字起こしに対応するSpeech-to-Text API。低遅延の音声製品やAIエージェント、コンタクトセンター向け。
TongueTypeは、Whisper AIで音声をローカル変換し、カーソル位置にテキストを挿入できるmacOS向け音声入力アプリです。音声・動画ファイルの文字起こしにも対応し、クラウド処理、アカウント、サブスクは不要です。
Carbon Voiceは、チーム向けの非同期音声メッセージアプリ。人とAIエージェントを一元管理し、文字起こし付き音声更新を送信、音声やテキストで返信でき、デスクトップ・モバイル・watch・ウィジェットから利用可能。
TicoはWindows向けAIアシスタント。声の質問を聞いて画面内容を理解し、クリックすべき場所を示しながら音声で手順を案内します。
SnaplyはMacで会議を録音し、全文書き起こし・要約・アクションアイテムを作成。プライバシー配慮のローカル処理で編集メモに。
Memoket Gemは会話を録音してAIツール向けの文脈に変換。ワンプレスでキャプチャするウェアラブルデバイスです。
AssemblyAI Voice Agent APIで音声をストリーミング入力し、音声出力をリアルタイム取得。逐語のどもり/音声タグ/話者役/コードスイッチ対応。
OraはmacOSのオンデバイス同時通訳。音声を外部サーバーに送らず、会話をリアルタイムに字幕(途中結果)で翻訳。無料で利用可。
SpeakMacはMac向けオフライン音声入力アプリ。オンデバイス処理で現在のウィンドウに文字起こし。25+言語対応、買い切りでサブスク不要。
SpeakONはiPhoneの音声入力デバイス。1ボタンで話すだけで、書いているアプリに整った文章テキストを送ります。
HarkerはmacOS向け無料の音声入力アプリ。グローバルショートカットでどこでも入力し、音声をテキスト化。PremiumはAI文体や翻訳も。
xAIのGrok Speech to Text・Text to Speech APIで音声/テキスト変換。低遅延REST/WebSocket、話者分離やTTS音声タグ等に対応。