UStackUStack
DeltaMemory favicon

DeltaMemory

DeltaMemoryは、本番環境のAIエージェントに永続的な記憶、自動的な事実抽出、および累積的なコンテキストインテリジェンスを付与するために設計された、認知メモリレイヤーインフラストラクチャです。

DeltaMemoryとは?

DeltaMemoryとは?

DeltaMemoryは、本番グレードのAIエージェントにとって不可欠な認知メモリレイヤーとして機能し、エージェントの忘却という重大な問題を解決します。従来のAIエージェントは、長期間にわたってコンテキストを維持したり、過去のやり取りを正確に記憶したりするのに苦労し、その結果、会話の繰り返しやパフォーマンスの低下を招きます。DeltaMemoryは、永続的で構造化された検索機能を提供することでこれを修正し、エージェントが過去の知識に基づいて動的に構築できるようにします。これはインフラストラクチャレイヤーとして機能し、すべてのやり取りが成長しアクセス可能なナレッジベースに貢献することを保証し、実際のアプリケーションにおけるエージェントの精度と効率を大幅に向上させます。

このプラットフォームは、パフォーマンスとスケーラビリティのために設計されており、検索速度とコスト削減において業界をリードするベンチマークを誇ります。生の会話ログから構造化された事実を自動的に抽出し、ナレッジグラフを構築することにより、DeltaMemoryは大規模なトークン圧縮(最大3,714倍)を実現します。これは、エージェントが履歴全体を再処理する計算オーバーヘッドなしに、重要な情報のみを記憶することを意味します。その結果、検索速度が2倍に向上し、生のトークン再処理と比較してコストが97%削減され、LoCoMoのような長期会話ベンチマークで優れたパフォーマンスを発揮します。

主な機能

  • 永続的な記憶とコンテキストインテリジェンス: エージェントはセッションを超えて長期記憶を維持し、時間の経過とともに蓄積される、パーソナライズされたコンテキスト認識型のやり取りを可能にします。
  • 自動事実抽出とナレッジグラフ: 生の会話データは、効率的なセマンティック検索を可能にするために、構造化された事実と相互接続されたナレッジグラフに自動的に変換されます。
  • 極端なトークン圧縮: データを構造化することで最大3,714倍の圧縮を達成し、記憶に必要なコンテキストウィンドウサイズを劇的に縮小し、大幅なコスト削減(97%削減)につながります。
  • 高性能と低遅延: Rustベースのエンジンを搭載し、50msのp50クエリ遅延を実現し、本番システムでのリアルタイム応答性を保証します。
  • フレームワークネイティブ統合: Vercel AI SDK、LangChain、CrewAI、n8nを含む人気の高いエージェントフレームワーク向けのファーストクラスのSDKサポートを提供し、迅速な統合を可能にします。
  • 組み込みの可観測性とトレーサビリティ: すべてのメモリ操作は完全にトレースされ、抽出された事実、記憶された情報、および重要度スコアの可視性を提供し、堅牢なデバッグと監査を可能にします。
  • エンタープライズ対応: SOC 2準拠準備、HIPAA準拠準備、監査グレードのセキュリティ、および99.9%のアップタイムSLAを備え、本番環境向けに設計されています。
  • 柔軟なデプロイメント: マネージドクラウドサービスまたはお客様自身のVPC内でのオンプレミス展開をサポートし、データの主権と制御を保証します。

DeltaMemoryの使用方法

既存のAIエージェントスタックへのDeltaMemoryの統合は、最小限のエンジニアリング作業で迅速かつ簡単に行えるように設計されています。

  1. SDKのインストール: まず、DeltaMemory SDKをアプリケーション環境にインストールします。
  2. 接続の初期化: DeltaMemoryクライアントをインスタンス化し、DeltaMemoryインスタンスに接続します(例:ホストアドレスを指定します)。
  3. データの取り込み: 一意のユーザー識別子と新しいメッセージまたはデータポイントを渡して、ingestメソッドを使用します。DeltaMemoryは、バックグラウンドで処理、事実抽出、圧縮を自動的に処理します。
  4. 情報の検索: エージェントがコンテキストを必要とする場合は、ユーザーIDを指定してrecallメソッドを使用します。システムは、最も関連性の高い圧縮された記憶と構造化された事実を即座に取得します。
  5. フレームワーク統合: 既存のエージェントワークフロー(LangChainチェーンなど)の場合、古い、効率の低いメモリソリューションと交換するために数行のコードが必要なだけで、DeltaMemoryコネクタを既存のメモリ設定スロットにドロップインします。

ユースケース

DeltaMemoryは、AIエージェントがユーザーやデータと繰り返しやり取りするあらゆるシナリオで、累積的なインテリジェンスを提供します。

  • ヘルスケア(医療AIアシスタント): 医療AIアシスタントは、患者の病歴、投薬の相互作用、および述べられた好みの準拠した永続的な記録を複数のセッションにわたって維持できます。例えば、セラピーチャットボットは、3セッション前に言及された特定の不安の引き金(トリガー)を記憶するため、患者が機密情報を繰り返す必要がなくなります。
  • 教育(パーソナライズされたチューター): AIチューターは、個々の学生の蓄積された理解を活用します。システムは学習の進捗を追跡し、永続的な知識のギャップ(例:二次方程式での苦戦)を特定し、その後のレッスンで指導スタイルと難易度を自動的に調整します。
  • Eコマース(超パーソナライズされたショッピング): ショッピングアシスタントは、すべてのやり取りから深い好み(プリファレンス)のプロファイルを作成します。顧客が一度持続可能なブランドとサイズMを好むと述べた場合、エージェントはこの情報を保持し、将来のすべての推奨事項が繰り返しプロンプトなしに関連するようにします。
  • カスタマーサポート(コンテキスト認識エージェント): サポートエージェントは、過去のチケット、好み、以前の解決パスを含む、すべての顧客とのやり取りの完全な履歴に即座にアクセスできます。このコンテキストはエスカレーションに伴って移動するため、顧客に問題の再説明を求めることなく初回コンタクトでの解決が可能になります。
  • セールスインテリジェンス: セールスAIは、さまざまなタッチポイント(メール、チャット)にわたる見込み客とのやり取り、異論、購入シグナルを追跡します。すべてのフォローアップは関係履歴全体に基づいて行われるため、エージェントは以前の議論に基づいて予算関連のフォローアップのタイミングを完璧に計ることができます。

FAQ

Q: DeltaMemoryはどのようにしてこれほど高いトークン圧縮を実現するのですか? A: 単純なベクトル埋め込み以上のことを行います。DeltaMemoryは生の会話ログを分析して構造化された事実を自動的に抽出し、セマンティックナレッジグラフを構築します。この構造化された表現は、生のテキストや密な埋め込みを保存するよりもはるかに効率的であり、数千の関連データポイントに数百万のトークンを圧縮することを可能にします。

Q: DeltaMemoryは現在のLLMやフレームワークと互換性がありますか? A: はい。DeltaMemoryは本質的にフレームワークに依存しませんが、LangChain、CrewAI、Vercel AI SDKなどの人気のあるツールとファーストクラスのネイティブ統合を提供します。専用のメモリレイヤーとして機能するため、事実上すべてのLLMプロバイダーと統合できます。

Q: エンタープライズ利用のために、DeltaMemoryはどのようなセキュリティおよびコンプライアンス基準を満たしていますか? A: DeltaMemoryはエンタープライズ要件を念頭に置いて構築されており、アーキテクチャにSOC 2準拠準備およびHIPAA準拠準備が組み込まれています。メモリグラフの暗号学的所有権と細粒度の同意制御を提供し、クラウドまたはオンプレミスでのデプロイメントに関わらずデータセキュリティを保証します。

Q: DeltaMemoryと標準のベクトルデータベースとの違いは何ですか? A: 標準のベクトルデータベースは主に生のテキストの埋め込みを保存し、コンテキスト全体を再埋め込みして検索する必要があります。DeltaMemoryは意味を構造化された事実とグラフに抽出し、これにより(LoCoMoベンチマークで検証された)より高速で正確な検索と、再処理の最小化による運用コストの大幅な削減につながります。

Q: DeltaMemoryを独自のプライベートクラウドまたはVPC内にデプロイできますか? A: もちろんです。DeltaMemoryは完全なデプロイメントの柔軟性を提供します。マネージドクラウドサービスを利用することも、お客様自身の仮想プライベートクラウド(VPC)内にDeltaMemoryをオンプレミスでデプロイして、データレジデンシーとセキュリティ体制に対する完全な制御を維持することもできます。

DeltaMemory | UStack