Wallie
Wallieは、リアルタイム視覚、設定可能な人格プロファイル、チャット連携、音声合成、アバター出力を備えたオープンソースのAI配信フレームワーク。Twitch、YouTube、Kick向けのVTuber・AI配信に最適。
Wallieとは?
Wallieは、リアルタイム視覚、設定可能な人格システム、チャット連携、音声合成、リップシンク対応アバターのワークフローを備えた、バーチャル配信者やVTuber向けのオープンソースAI配信フレームワークです。クリエイターのマシン上でローカルに動作し、Twitch、YouTube、Kickなどの配信プラットフォームと接続するよう設計されています。
このプロジェクトは、配信者を短いデモのループではなく、継続するキャラクターのように振る舞わせることに重点を置いています。リポジトリによると、Wallieは継続中の話題を追跡し、以前の会話を要約して文脈を失わないようにし、画面上の内容に反応し、出力を音声、OBS、VTube Studioへルーティングできます。
主な機能
- AI、音声、チャットのプロバイダーを差し替え可能 — このフレームワークは複数のLLM、TTS、チャットの विकल्पに対応しており、コードベースを変更せずにプロファイルごとにプロバイダーを組み合わせられます。
- 構造化された人格設計 — プロファイルには、アイデンティティ、声の特徴、ユーモアのスタイル、下品な言葉の度合い、決め台詞、タブー話題、意見、追加メモが含まれ、より一貫したキャラクター作りに役立ちます。
- リアルタイム視覚パイプライン — Wallieは視覚コンポーネントを通じて画面内容に反応でき、ナレーションが不要な状況ではスキップする挙動も備えています。
- 長時間セッション向けのメモリ処理 — ローリング要約が古いやり取りをメモへ圧縮し、そのメモがプロンプトに再投入されるため、長時間の配信でも一貫性を保てます。
- 配信向け出力ルーティング — 音声をTTS経由でOBSまたは仮想ケーブルへ送る構成になっており、VTube StudioによるLive2Dアバター対応もあります。
- ブラウザベースの設定 — ソースではブラウザから設定可能とされており、コードを毎回編集せずにプロファイル、プラットフォーム、その他の設定を調整しやすくなっています。
Wallieの使い方
一般的なセットアップでは、まず人格を選び、LLMとTTSプロバイダーを選択し、使用したいチャットプラットフォームとアバターワークフローを接続します。プロジェクトにはインストール用スクリプトとクイックスタート手順が含まれており、ユーザー自身のマシンでローカルに導入する流れが想定されています。
セットアップ後は、配信中にWallieを起動し、チャットと視覚入力を読み取り、キャラクター性のある応答を生成し、OBSまたは仮想ケーブル向けに音声を出力します。必要に応じて、プロファイルの切り替え、人格設定の更新、プロバイダーの変更が可能です。
利用シーン
- 継続性のあるキャラクターでのVTuber配信 — クリエイターは、汎用的なチャットボット音声ではなく、意見、ユーモア、背景設定を持つキャラクターを運用できます。
- 画面を認識するライブコメント — 視覚パイプラインにより、チャットだけでなく、ブラウザ、アプリ、ゲームなど画面に表示されている内容に対して配信者がコメントしやすくなります。
- 長時間のライブ配信 — メモリと要約のシステムは、文脈のズレが問題になりやすい長時間配信に適しています。
- オフラインまたは自前ホストの実験 — OllamaやPiperなどのローカルオプションが挙げられており、クラウドサービスのみに依存したくないユーザーにも適しています。
- カスタム配信者プロトタイプ — 開発者や技術系クリエイターは、このフレームワークを基盤に、さまざまなAI配信者の人格やワークフローを構築・検証できます。
FAQ
Wallieは1つの配信プラットフォーム専用ですか?
いいえ。リポジトリではTwitch、YouTube、Kickのサポートが記載されています。
Wallieはローカルモデルやローカル音声で動作しますか?
はい。ソースには、ローカルLLMの選択肢としてOllama、ローカルTTSの選択肢としてPiperが記載されています。
Wallieはアバターに対応していますか?
はい。プロジェクトでは、VTube Studio経由のLive2Dアバター対応が示されています。
これは完成済みのSaaS製品ですか?
いいえ。これは、ユーザーのマシン上で動作し、プロジェクトのセットアップを通じて設定するオープンソースのフレームワークです。
代替案
- 汎用AIチャットボットのオーバーレイ — これらはチャット返信や基本的な配信インタラクションに特化した、よりシンプルなツールですが、通常ここで説明するようなペルソナ構造、メモリ管理、ビジョンワークフローは含みません。
- 台本付き対話を使う従来型VTuberソフト — 手動操作に依存するアバターおよび配信ツールは扱いやすい場合がありますが、チャットや画面コンテキストからライブのキャラクター行動を生成することはありません。
- 個別コンポーネントを組み合わせたカスタム配信スタック — 一部のクリエイターは、LLM、TTS、OBS自動化、アバターツールを組み合わせて独自のソリューションを構築します。その方法は柔軟ですが、Wallieはそれらを1つのフレームワークにまとめています。
- ライブチャンネル向けの音声のみAIコンパニオン — 反応的なコメントは可能ですが、通常はアバター連携や配信向けのオーケストレーションにはあまり重点を置いていません。
代替品
Codex Plugins
Codex Pluginsでスキル、アプリ連携、MCPサーバーを再利用可能なワークフローにまとめ、Gmail・Google Drive・Slack等のツールにアクセス。
PXZ AI
画像、動画、音声、ライティング、チャットのツールを統合したオールインワンAIプラットフォームで、創造性とコラボレーションを高めます。
Gemma AI
Gemma AIは、重要なタスク、予定、締め切りを絶対に忘れないように、パーソナライズされたインテリジェントな音声リマインダーで直接電話をかけてくるスマートアプリケーションです。
Spotit
SpotitはmacOSアプリ。別アプリで行き詰まると画面を読み取り、声の質問と表示ガイドでクリック箇所を提示します。
AakarDev AI
AakarDev AIは、シームレスなベクターデータベース統合を通じてAIアプリケーションの開発を簡素化し、迅速な展開とスケーラビリティを実現する強力なプラットフォームです。
Whirr
WhirrはmacOSのメニューバー常駐アプリ。Claude Codeエージェントの作業状況をノッチに静かにミラーし、画面確認なしで一目確認。