TongueTypeとは?
TongueTypeは、ホットキーを押しながら話し、離すと文字起こししたテキストをカーソル位置に挿入できるmacOS向け音声入力アプリです。Apple Silicon Mac上でWhisper AIをローカル実行するため、文字起こしはクラウドではなくデバイス上で行われます。
このアプリは、メール、チャット、メモ、プロンプト、コードコメントなどで、素早くハンズフリーで入力する用途向けに設計されています。音声・動画ファイルからの文字起こしにも対応しており、外部サービスへファイルをアップロードせずに録音音声をテキスト化できます。
主な機能
- Apple Silicon Mac上でWhisper AIによるローカル文字起こしを行うため、音声はデバイス上に保持されます。
- プッシュトゥトーク式の入力フロー:ホットキーを押しながら話し、離すとカーソル位置にテキストを挿入します。
- 12言語対応で、自動言語検出を備えています。
- WAV、MP3、MP4、MOV入力のファイル文字起こしに対応し、ライブ音声入力以外にも使えます。
- Dockアイコンやメインウィンドウのないメニューバーアプリ設計で、作業領域を圧迫せずに常駐できます。
- ホットキー、起動猶予時間、ダブルタップのラッチモード、オーバーレイの外観、挿入動作をカスタマイズできます。
- [music]や(laughter)のような注釈の削除、音声フレーズによる入力キャンセル、「改行」や「クエスチョンマーク」などの音声キューのマッピングに対応した後処理ルール。
- iCloudでMac間の設定を同期でき、環境設定をデバイス間で引き継げます。
TongueTypeの使い方
対応Macにアプリをインストールし、ホットキーを設定するかデフォルトのまま使います。入力したいときはキーを押し続け、自然に話してから離すと、現在のアプリのカーソル位置に文字起こし結果が挿入されます。
録音ファイルの場合は、対応する音声・動画ファイルをTongueTypeにドラッグすると、内容がローカルで文字起こしされます。通常利用前に、言語動作、外観、テキストの整形に関する設定も調整できます。
使用例
- メールやSlackメッセージを、入力より速く作成したいとき。特に、入力のために文脈を切り替えずに話したい場合。
- コードコメント、プロンプト、短い技術メモをエディタに直接下書きするとき。
- WAV、MP3、MP4、MOVファイルとして保存された会議録音、インタビュー、ボイスメモを文字起こしするとき。
- 音声をMac内に残したい、プライバシー重視のワークフローで音声入力を使うとき。
- キーボード入力がつらい、遅い、または現実的でないユーザーの代替入力手段として音声を使うとき。
FAQ
TongueTypeはクラウドベースですか?
いいえ。説明文では、文字起こしはWhisper AIでMac上でローカル実行され、音声はデバイス外に出ないとされています。
TongueTypeはライブ音声入力とファイル文字起こしの両方に対応していますか?
はい。ライブのプッシュトゥトーク音声入力と、対応する音声・動画ファイルの文字起こしの両方に対応しています。
対応言語は?
ページでは、TongueTypeは12言語に対応し自動検出を備えているとされていますが、英語、スペイン語、フランス語、ドイツ語、日本語、中国語、韓国語などの例以外に完全な一覧は記載されていません。
無料版はありますか?
はい。ページでは、無料版でもすべての機能が使え、毎月30分のライブ音声入力と、各ファイルの最初の10秒に制限されたファイル文字起こしが含まれると述べています。
対応プラットフォームは?
TongueTypeは、Apple Silicon Mac向けのmacOS 14以降に対応しています。
代替案
- macOS標準の音声入力:基本的な音声テキスト変換向けのよりシンプルなシステムレベルの選択肢ですが、ここで説明されているのと同じローカルWhisperベースのワークフローやカスタマイズ性は備えていないようです。
- クラウドベースの音声入力アプリ:クロスプラットフォーム対応やアカウント連携の同期を提供する場合がありますが、一般的には文字起こしを完全ローカルにせず、音声を外部サービスへ送信します。
- 汎用文字起こしツール:録音をテキストに変換する用途が主なら適していますが、現在アクティブなアプリに即座に挿入する用途には最適化されていない場合があります。
- 音声入力拡張やアクセシビリティユーティリティ:音声を代替入力手段として必要とするユーザーに役立ちますが、ホットキー駆動の音声入力よりも、システム全体の操作、アクセシビリティ機能、メモ取りなど異なるワークフローを重視することがあります。
代替品
Speech to Text Converter Online
オーディオおよびビデオファイルを45以上の言語で正確なテキストトランスクリプトに変換する無料のオンラインツールです。多数のファイル形式をサポートしており、ダウンロードやサインアップは不要です。
Dictato
DictatoはmacOSのオフライン音声入力アプリ。Whisper/Parakeet/Appleエンジンに対応し、クラウドなしでその場で文字起こし。
Ringg Parrot STT V1
Ringg Parrot STT V1は、ヒンディー語・英語・コードミックス音声のリアルタイム/ファイル文字起こしに対応するSpeech-to-Text API。低遅延の音声製品やAIエージェント、コンタクトセンター向け。
Sanota
Sanotaは音声を明快で美しい文章に変換。思い出やアイデアを気軽に書き起こして、無料で始められます。
Carbon Voice
Carbon Voiceは、チーム向けの非同期音声メッセージアプリ。人とAIエージェントを一元管理し、文字起こし付き音声更新を送信、音声やテキストで返信でき、デスクトップ・モバイル・watch・ウィジェットから利用可能。
OpenAI Realtime API
OpenAI Realtime APIで低遅延なマルチモーダル音声・リアルタイム体験を構築。ブラウザ音声エージェントやリアルタイム文字起こしにも対応。