Ghost Pepperとは?
Ghost Pepperは、macOS向けの音声ディクテーションおよび会議文字起こしアプリで、音声をテキストに変換し、通話の文字起こしをローカルマシン上でキャプチャします。オーディオをクラウドサービスに送信せずに音声-to-テキストのワークフロー(ディクテーション、通話メモ、文字起こし)を実現したいユーザー向けに設計されています。
アプリはApple Silicon(M1+)のオンデバイスモデルで100%ローカル実行し、文字起こしと要約をローカルファイルとして出力します。プロジェクトはMITライセンスの下で無料・オープンソースです。
主な機能
- プッシュトゥトーク式音声ディクテーション: Controlキーを押して話しかけ、離すと文字起こしし、結果を任意のテキストフィールドに貼り付け。
- ローカルMarkdownとして保存される会議文字起こし: 通話録音からノート、文字起こし、AI生成要約を作成し、ローカルMarkdownファイルとして保存。
- オンデバイスの音声クリーンアップ: ローカルLLMがフィラー言葉の除去、自己訂正の修正、音声のクリーンアップを実行。
- Mac上で100%ローカル実行: コア機能はApple Silicon上でオンデバイス実行。クラウドへのアップロード、追跡、保存なし。
- 複数の音声-to-テキストモデルオプション: Whisper(tiny.en, small.en)やParakeet v3などのローカルASRモデルを使用。言語カバレッジと性能のトレードオフあり。
- ローカルプライバシー検証とテレメトリなし: サイトではAIコードレビューによる「プライバシー監査」を記述し、アナリティクス/テレメトリSDKなしと明記。
Ghost Pepperの使い方
- ダウンロードとインストール:
GhostPepper.dmgファイルをダウンロードし、Ghost PepperをApplicationsフォルダにドラッグ。 - 権限付与: プロンプトでmacOSのMicrophoneおよびAccessibility権限を許可。
- 入力/トリガーの設定: ビルトインのControlキー動作を使用—Controlを押して話しかけ、離すと文字起こし。
- 会議での使用: 会議文字起こしでは通話を録音し、文字起こし出力を生成。アプリが結果(文字起こし/ノート/要約)をローカルMarkdownとして保存。
- macOSがアプリをブロックする場合: 「Apple could not verify」警告が出たら、System Settings > Privacy & SecurityでOpen Anywayを選択。
ユースケース
- ハンズフリー文書編集: プッシュトゥトークでメール、文書、ノートに文をディクテーションし、文字起こしをテキストフィールドに貼り付け。
- 音声からの個人学習やブレインストーミング: 音声クリーンアップでフィラー言葉を除去・自己編集を修正後、発話アイデアをクリーンなテキストとしてキャプチャ。
- チーム会議ドキュメント(オフライン workflow): 会議を録音し、ノート、文字起こし、要約をMac上のMarkdownとして生成。
- 言語特化の文字起こしニーズ: 英語限定出力(例: Whisper tiny.en/small.en)か広範言語対応(例: Parakeet v3, Qwen ASR variants)でモデルを選択。
- プライバシー重視の文字起こし: オーディオや入力がデバイス外に出ないローカルオンリー処理を使用。
FAQ
-
Ghost Pepperはユーザーアカウントが必要ですか?
ページによるとアカウント不要です。 -
オーディオはクラウドに送信されますか?
サイトでは全モデルがMac上で実行され、アップロード・追跡・クラウド保存なしと明記。 -
必要なハードウェアは?
ダウンロード情報ではmacOS 14.0+とApple Silicon(M1+)を指定。 -
ディクテーションの開始方法は?
Controlキーを押して話し、離すと文字起こししてテキストを対象フィールドに貼り付け。 -
会議出力はどこに保存される?
ページでは会議の文字起こし/ノート/要約がローカルMarkdownファイルとして保存されると記述。
代替品
- macOSのローカル音声-to-テキストアプリ: オンデバイス/オフライン処理を重視した他のデスクトップディクテーション・文字起こしツール。類似のプッシュトゥトークや文字起こしワークフローに適。
- クラウド文字起こしサービス(非ローカル): WebベースやAPI駆動のソリューション。広範な言語/モデルオプションを提供するが、一般にオーディオをプロバイダに送信し、Ghost Pepperのローカルオンリーアプローチと対照。
- 汎用オフライン文字起こし+テキストクリーンアップツール: 文字起こし(ASR)と別途テキスト編集/クリーンアップに特化したツール。Ghost Pepperのディクテーション+クリーンアップ+ローカル保存に似たワークフローに組み合わせ可能。
代替品
Speech to Text Converter Online
オーディオおよびビデオファイルを45以上の言語で正確なテキストトランスクリプトに変換する無料のオンラインツールです。多数のファイル形式をサポートしており、ダウンロードやサインアップは不要です。
Dictato
DictatoはmacOSのオフライン音声入力アプリ。Whisper/Parakeet/Appleエンジンに対応し、クラウドなしでその場で文字起こし。
Memo AI
音声およびビデオファイルをテキストに変換するAI駆動の転写サービス。
Sanota
Sanotaは音声を明快で美しい文章に変換。思い出やアイデアを気軽に書き起こして、無料で始められます。
OpenAI Realtime API
OpenAI Realtime APIで低遅延なマルチモーダル音声・リアルタイム体験を構築。ブラウザ音声エージェントやリアルタイム文字起こしにも対応。
Pewbeam
Pewbeamは説教をリアルタイムで聞き取り、聖書箇所を瞬時に検出して画面表示。入力や操作なしで投影をサポート。