Voxとは?
Voxは、MacとWindows向けのオンデバイスAI音声入力アプリです。ホットキーを押しながら自然に話すだけで、音声や文字起こしをクラウドサービスに送信せずに、整えられたテキストをクリップボードから貼り付けられます。
このアプリは、最小限の設定で素早くテキスト入力できるよう設計されています。デフォルトのホットキーが用意されており、文字起こしと整形はローカルモデルで行い、初回のモデルダウンロード後はインターネットなしでも動作します。Voxは、入力先のアプリに合わせて出力スタイルも調整でき、一般的な文章、メール、チャット、コードコメント、メモ向けのモードがあります。
主な機能
- オンデバイスでの文字起こしと整形により、音声入力はクラウド往復ではなくローカルで処理されます。
- MacとWindowsに対応し、各プラットフォーム用のホットキーがあります。
- クリップボード中心のワークフロー:ショートカットを押し、話し、離してから、整えられたテキストを好きな場所に貼り付けます。
- 一般文、メール、チャット、コードコメント、メモ、またはカスタムモードに応じて書式を変える、アプリ対応の音声モード。
- 利用にアカウントは不要で、製品ページによると音声入力のテレメトリも収集されません。
- 初回起動時のモデルダウンロード後はオフラインで動作します。
Voxの使い方
お使いのプラットフォーム向けにアプリをインストールし、デフォルトのホットキーで音声入力を開始します。Macではショートカットは ⌘⌥.、Windowsでは Ctrl+Alt+. です。
Voxが聞き取っている間は通常どおり話し、終わったらホットキーを離して停止します。アプリは整えられたテキストをクリップボードに入れるので、通常の貼り付けコマンドで目的のアプリに貼り付けます。
利用例
- ラフな下書きを話して、Voxに完全なメール本文へ整形させることで、メール作成を দ্রুত化する。
- Slack、Discord、iMessageで、よりカジュアルで短めの出力スタイルの短いチャットメッセージを送る。
- 識別子を保持しつつ現在形の表現を使って、コードコメントやその他の開発メモを音声入力する。
- 会議メモ、タスクリスト、ブレストメモを、より整った構造で記録する。
- 初回モデルダウンロード後、オフラインや接続が限られる環境で音声入力を使う。
FAQ
Voxの利用にアカウントは必要ですか?
個人利用ではアカウントは不要です。ページには、商用ライセンスはStripeの請求処理を通じて別途扱われると記載されています。
Voxは音声や文字起こしをクラウドに送信しますか?
いいえ。製品ページでは、音声、文字起こし、クラッシュレポートはいずれも端末外には送られないと説明されています。
Voxはインターネットなしで使えますか?
はい、初回起動時に一度モデルをダウンロードした後は使えます。ページでは、その後はインターネットなしで実行できると案内されています。
Voxはどのプラットフォームに対応していますか?
VoxはMacとWindowsで利用できます。ページには、macOS 14+ を搭載した Apple Silicon Mac と Windows 10/11 x64 が記載されています。
代替案
- クラウド処理に依存する従来のデスクトップ音声入力ツール:音声認識を比較したい場合はこちらのほうが見比べやすいですが、通常はローカル処理ではなくオンライン往復を使います。
- OS標準の音声入力:よりシンプルで既に入っていることが多いですが、同じようなアプリ別整形モードやクリップボード優先のワークフローは備えていない場合があります。
- 音声入力付きの汎用AIライティングツール:書き換えや下書き作成には役立ちますが、通常はシステム全体の音声入力ではなく、エディタやチャット画面を中心にしています。
- 手動入力:正確な修正には今でも有効ですが、Voxが狙っている速度の利点は得られません。
代替品
Speech to Text Converter Online
オーディオおよびビデオファイルを45以上の言語で正確なテキストトランスクリプトに変換する無料のオンラインツールです。多数のファイル形式をサポートしており、ダウンロードやサインアップは不要です。
Dictato
DictatoはmacOSのオフライン音声入力アプリ。Whisper/Parakeet/Appleエンジンに対応し、クラウドなしでその場で文字起こし。
Ringg Parrot STT V1
Ringg Parrot STT V1は、ヒンディー語・英語・コードミックス音声のリアルタイム/ファイル文字起こしに対応するSpeech-to-Text API。低遅延の音声製品やAIエージェント、コンタクトセンター向け。
Sanota
Sanotaは音声を明快で美しい文章に変換。思い出やアイデアを気軽に書き起こして、無料で始められます。
Carbon Voice
Carbon Voiceは、チーム向けの非同期音声メッセージアプリ。人とAIエージェントを一元管理し、文字起こし付き音声更新を送信、音声やテキストで返信でき、デスクトップ・モバイル・watch・ウィジェットから利用可能。
OpenAI Realtime API
OpenAI Realtime APIで低遅延なマルチモーダル音声・リアルタイム体験を構築。ブラウザ音声エージェントやリアルタイム文字起こしにも対応。