UStackUStack
Glassbrain icon

Glassbrain

GlassbrainはOpenAI・Anthropic・LangChainのLLMワークフローを可視化してトレース/リプレイ。共有セッションと修正提案で原因を特定。

Glassbrain

Glassbrainとは?

GlassbrainはAI駆動アプリケーションの視覚デバッグツールです。AI実行の各ステップ(ユーザー入力から解析、リトリーブ、LLM呼び出し、最終出力まで)をキャプチャし、それをインタラクティブでクリック可能なトレースツリーとして表示します。

出力が間違っていたり本番で失敗したりした場合、Glassbrainは任意のステップ背後のデータを検査したり、入力を調整したり、その時点から再実行したりすることで原因を特定します。再デプロイ不要です。また、エラーを報告するだけでなく、何を変えるべきかに焦点を当てた修正提案も提供します。

主な機能

  • 推論チェーンの視覚トレースツリー: ワークフローをノード(例: 入力、パーサー、リトリーバー、ドキュメントストア、LLM呼び出し、フォーマッター、最終出力)として表示し、問題が発生した箇所を特定。
  • インタラクティブなノード検査: トレースの部分にホバーまたは選択して中間データを確認。長い生ログを読む必要なし。
  • タイムトラベルリプレイ: 任意のノードをクリックして入力を変更し、その時点から再実行。修正を再デプロイなしで検証。
  • ビフォー/アフター差分ビュー: 「前」と「後」の結果を並べて比較し、改善や変更を視覚化。
  • AI修正提案: 失敗内容に基づき、調整すべき具体策(例: 温度変更やstrict JSONモード有効化)を生成。
  • 共有可能なデバッグセッション: デバッグセッションのURLを作成し、チームメンバーが同じトレースとコンテキストを確認。
  • 1行セットアップでトレース開始: npm install glassbrainをインストールして1つのimportを追加するだけ。

Glassbrainの使い方

  1. npm install glassbrainインストールし、アプリに1つのimportを追加してトレースをキャプチャ。
  2. AIアプリケーションで問題を再現(例: 誤った回答や失敗実行)。
  3. Glassbrainでセッションを開き、トレースツリーを表示して問題ステップを特定。
  4. 検査とリプレイ: 該当ノードをクリックして入力を変更し、その時点からリプレイして修正を迅速テスト。
  5. ビフォー/アフター差分ビューで結果を確認し、デバッグリンクをチームに共有。

ユースケース

  • サポートチャットボットの精度レビュー: ユーザーが誤応答を報告(例: 返品ポリシー期間の不一致)した場合、トレースツリーでモデルの推論やリトリーブの誤りを特定。
  • 本番障害診断: OpenAI API呼び出し中のレートリミットなどのエラーで、トレースを検査して根本原因と再試行動作の影響を確認。
  • プロンプトや生成パラメータの反復: 出力形式が不安定な場合、提案変更(strict JSONモード有効化や温度低下など)を適用し、リプレイと差分ビューで効果検証。
  • リトリーブステップを含むLLMワークフローデバッグ: 問題が初期段階(解析、リトリーブ、ドキュメントストアインタラクション)由来の場合、正しいノードで診断。最終出力だけに頼らず。
  • チームベースのインシデント対応: デバッグセッションのリンクを共有し、チームで同じトレースを検査してリプレイ/修正を共同決定。

FAQ

Glassbrainは何をキャプチャする?

ユーザー入力から解析、リトリーブ、ドキュメントストレージ、LLM呼び出し、フォーマット、最終出力までのAI実行ステップをキャプチャし、インタラクティブなトレースツリーで表示。

タイムトラベルリプレイとは?

トレースのノードをクリックしてそのステップの入力を変更し、再デプロイなしでその時点からリプレイすることを意味します。

Glassbrainはどのモデル・フレームワークをサポート?

OpenAIAnthropicLangChainLlamaIndex、およびカスタムスタック向けOpenTelemetry互換エンドポイントをサポート。

チームとデバッグセッションを共有可能?

はい。Glassbrainはデバッグセッションの共有リンク(URL)を生成し、他者がトレースとコンテキストを確認可能。

Glassbrainはお試し無料?

はい。Freeプランが**$0/月**で、クレジットカード不要。

代替ツール

  • ログとトレースを使用したオブザーバビリティ/テレメトリツール(例: OpenTelemetryベースのワークフロー): システムアクティビティのキャプチャに有用ですが、通常は手動ログ解析が必要で、同じノードレベルのリプレイやインタラクティブなトレースツリーのワークフローを提供しない場合があります。
  • LLMアプリケーション監視プラットフォーム(トレースと評価指向): AIワークフローのトレースデータを収集する点で類似;主な違いは、タイムトラベルリプレイ、前後差分表示、セッション共有をコアUXに含むかどうかです。
  • SDKレベルのインストゥルメンテーションによる従来のエラーデバッグ: APIコールの障害特定に役立ちますが、入力から最終出力までのAIパイプライン全体の統一視覚トレースが不足しがちです。
  • プロンプト中心のデバッグ・評価ツール: プロンプト挙動が主な問題の場合に有用ですが、リトリーバルやドキュメントストアとのやり取りなどのエンドツーエンドのワークフロー手順を同じようにカバーしない場合があります。
Glassbrain | UStack