UStackUStack
Agentset icon

Agentset

AgentsetはオープンソースのRAG基盤。引用付きの検索・Q&A、マルチモーダル取り込み、メタデータで絞り込み対応。

Agentset

Agentsetとは?

Agentsetは、開発者が製品内で検索とQ&Aを提供する本番運用可能なRAG(retrieval-augmented generation)アプリケーションを構築するためのオープンソースのインフラプラットフォームです。デモを超えて信頼性高く動作させることに重点を置き、特に実際のユーザーが大規模ドキュメントコレクションとやり取りする場合に適しています。

サイトによると、Agentsetは取り込み、検索動作、引用やメタデータベースのフィルタリングなどの回答表示機能を「すぐに使える」形で提供することで、RAGパイプラインの構築・保守にかかるエンジニアリング作業を削減するよう設計されています。

主な機能

  • Q&Aと検索向け本番運用級RAG: 実際のデータと使用で露呈するギャップを解消するよう構築。
  • 評価ベンチマーク付き正確な回答: サイトではMultiHopQAやFinanceBenchのベンチマークを参照し、関連タスクでの回答品質を裏付け。
  • マルチモーダル対応(画像、グラフ、表): Agentsetはプレーンテキストだけでなく、画像、グラフ、表にネイティブ対応。
  • 自動引用: 回答に引用が含まれるため、ユーザーが応答の元ソースを確認可能。
  • メタデータフィルタリング: インデックス済みデータのサブセットでフィルタリングし、システムが取得・回答する範囲を制限。
  • 開発者向けAPIとSDK: データアップロード用のJavaScriptおよびPython SDKを提供。サポートファイル形式(以下参照)や取り込みジョブ作成の使用例あり。
  • 幅広いファイル形式対応: PDF、DOCX、HTML、TXT、CSV、JSONライクなソース(HTML/TXT/CSV表示)、PPTX/XLSXなどのオフィス形式をサポート(ファイルタイプ一覧参照)。
  • モデル・ベクトルストアの柔軟性: モデル非依存で、ベクトルデータベース、エンベッドモデル、LLMを選択可能。
  • MCPサーバー統合: ナレッジベースを外部アプリケーションに接続するMCPサーバーあり。

Agentsetの使い方

典型的な開始は、アプリでAgentsetクライアントをインスタンス化し、名前空間を作成(または使用)して、インデックスしたいファイルへの取り込みジョブを送信することです。

その後、製品内でAgentsetの検索またはチャットインターフェースを使用:質問は取り込んだコンテンツからの検索で回答され、引用が自動付与されます。応答を絞り込む場合は、メタデータフィルタを適用して関連データのみを対象に。

ユースケース

  • 大規模コーパス向け法的検索と製品化AI Q&A: チームが広範なドキュメントセットで検索・質問回答を強化。インデックスコンテンツに基づく根拠ある回答と引用元。
  • 臨床・研究向け根拠回答: 正確性とトレーサビリティが重要時、引用と根拠検索でユーザーが基盤ドキュメントと照合。
  • 複雑メディア付き自治体・政策コンテンツ: 画像、グラフ、表を含むナレッジベース向けマルチモーダル対応。テキストのみのインデックスでは不十分。
  • 社内ナレッジベースアシスタント: 従業員が社内ドキュメントに質問可能。部門、期間、その他タグでメタデータフィルタリングによる検索制限。
  • フィードバック駆動チャットワークフロー: サイトでプレビューリンクやカスタマイズ可能チャットインターフェースを言及し、外部フィードバックを迅速収集。

FAQ

  • Agentsetはどのようなアプリケーションに対応? 他の製品内で検索とQ&Aを提供する本番運用可能なRAGアプリケーションを対象。

  • Agentsetはデモデータ以外でも動作? サイトでは多くのRAGデモが実際使用と大規模ドキュメントで失敗する問題を明記し、Agentsetを本番環境向けに位置づけ。

  • Agentsetはテキストドキュメント限定? いいえ。サイトでは画像、グラフ、表にネイティブ対応と記載。

  • Agentsetにソース帰属情報は含まれる? はい。回答に使用ソースを自動引用。

  • 独自のモデルやベクトルデータベースを使える? サイトではモデル非依存で、ベクトルデータベース、エンベッドモデル、LLMを選択可能と記載。

代替案

  • フレームワークベースのRAGスタック(例: RAGライブラリと独自パイプラインで構築): インフラプラットフォームを使わず、取り込み、再取得、回答整形を自分で組み立てる; 本番稼働レベルの信頼性に到達するには、より多くの統合作業が必要になる可能性がある。
  • マネージド検索/Q&Aサービス: 基本的な検索とチャット向けに高速セットアップが可能だが、マルチモーダル取り込みや特定の再取得/回答表示ニーズでは、開発者向けRAGプラットフォームに比べて柔軟性が低い場合がある。
  • カスタムツール付きセルフホストRAGパイプライン: フレームワークベースのアプローチと類似するが、再取得/取り込みインフラと統合をすべて社内で維持する必要がある。
  • AIアドオン付き汎用ナレッジベース・ドキュメント検索ツール: ドキュメント発見が主目的の場合に有用だが、Agentsetで説明される自動引用やメタデータフィルタ付き再取得などのRAG特化機能の深さに及ばない可能性がある。
Agentset | UStack