UStackUStack
Odyssey-2 Max icon

Odyssey-2 Max

Odyssey-2 Maxは、因果・行動条件付き次状態予測で開かれた未来をシミュレートする汎用ワールドモデル。VBench 2/PAI-Bench等で評価。

Odyssey-2 Max

Odyssey-2 Maxとは?

Odyssey-2 Maxは、世界が時間とともにどのように進化するかをシミュレートする汎用ワールドモデルです。現実世界の行動の視覚観測から学習し、次状態予測によりインタラクティブで因果的なロールアウトを生成します。固定されたプロンプト制約のビデオ生成ではなく、開かれた未来をサポートすることを目的としています。

主な目標はシミュレートされたダイナミクスの物理的正確性です。このページでは、Odyssey-2 Maxがワールドモデルの物理的正確性で最先端を進化させ、物理関連の評価ベンチマーク結果を報告しています。

主な特徴

  • インタラクティブロールアウトのための因果次状態予測: Odyssey-2 Maxは、前の状態と行動から各状態を予測する自己回帰的ワールドモデルとして位置づけられ、行動の変化に応じたリアルタイム進化を可能にします。
  • ロールアウト中の物理重視の安定性: モデルはダイナミクスを学習し、ステップバイステップで一貫性を保ち、ロールアウト進行時のドリフトや崩壊を低減します。
  • 視覚・行動のトレーニング信号(テキスト圧縮運動ではない): ページでは、現実世界の行動の視覚観測から直接学習することを強調し、テキストの反映からの学習と区別しています。
  • 物理メトリクスの向上のためのスケールアップモデルサイズ: ページでは、Odyssey-2 MaxがOdyssey-2 Proの約3倍のサイズで、スケール増加に伴う物理ベンチマークスコアの向上を報告しています。
  • 物理忠実度ベンチマークでの評価: VBench 2(物理サブスコアを含む)とPhysical AI (PAI) ベンチマークの物理サブセットの結果を引用しています。

Odyssey-2 Maxの使い方

提供されたページは、Odyssey-2 Maxをステップバイステップの製品インターフェースではなく概念的に説明しています。述べられたアーキテクチャと評価フレームに基づく典型的なワークフローは以下の通りです:

  1. 初期世界状態と以降の行動を提供(ページでは行動条件付き因果ロールアウトを強調)。
  2. モデルを実行し、前の状態と行動から各次状態を予測して時間経過での未来状態を生成。
  3. ページで参照される物理忠実度ベンチマーク(VBench 2物理およびPAI-Bench物理)で出力品質を評価。特にメカニクスと一貫性が目標の場合。

双方向ビデオアプローチと比較する場合、ページではOdyssey-2 Maxの適性がプロンプト固定の過去/現在/未来生成ではなく因果的・インタラクティブ予測に結びついていると示唆しています。

ユースケース

  • 研究プロトタイプのための物理忠実シミュレーション: 物理ダイナミクスを扱うチームは、Odyssey-2 Maxを使ってメカニクス、熱力学、材料を含むシナリオのステップバイステップ未来状態を生成(VBench 2物理サブスコア参照)。
  • 行動条件付き計画シナリオ: モデルが「行動とともにリアルタイムで進化」と記述されているため、後続決定がシミュレーションの未来結果に影響するワークフローに適します。
  • ロボティクスと制御コンセプトテスト: ページでロボティクスを対象アプリケーション領域に挙げ、変化する行動下での安定した因果次状態予測のニーズに合致。
  • ゲームとインタラクティブ環境: プレイヤー/エージェント行動に応じた一貫した進化を要するインタラクティブ設定に、因果ロールアウトが直接適合。
  • モデル比較とベンチマーク: 研究者は報告されたVBench 2およびPAI-Bench物理スコアを使って、モデルファミリー間のワールドモデル物理性能を比較可能。

FAQ

Odyssey-2 Maxは双方向ビデオモデルですか? いいえ。ページではワールドモデルと双方向ビデオモデル(Sora、Veo、Kling、Runwayを例に挙げる)を対比し、後者は事前に固定されたプロンプトから過去/現在/未来を共同生成するためリアルタイムインタラクションが制限されると述べています。

何が「ワールドモデル」として汎用テキスト/ビデオ生成器と異なるのですか? ページではワールドモデルを、因果的・インタラクティブなロールアウトで開かれた未来をシミュレートする学習するマルチモーダルシステムと位置づけています。主な違いは時間経過での行動条件付き次状態予測です。

ページでは物理精度をどう評価していますか? VBench 2での物理サブスコア(力学、熱力学、材料、多視点一貫性を含む)による評価と、PAI-Benchの物理モデリングサブセットでの評価を挙げています。

このページでの「リアルタイム」とは? ページでは「すべてのシミュレーションがリアルタイムで生成された」と述べ、Odyssey-2 MaxとOdyssey-2 Proの生成時間(例: 120秒以上)を示す比較表を含みます。製品レベルの「リアルタイム」の厳密な定義はこれ以上の指定はありません。

モデル品質はスケールで向上しますか? ページではOdyssey-2 Max(Odyssey-2 Proの約3倍のサイズ)がVBench 2とPAI-Benchで物理スコアを向上させたことを報告し、これを因果トレーニング下の次状態予測から生じる一貫したダイナミクスによるものとしています。

代替案

  • 双方向ビデオモデル(プロンプト固定生成): ページの記述通り、固定プロンプトから過去/現在/未来を共同生成し、同じような因果・行動条件付きインタラクションをサポートしません。
  • 次状態予測に最適化された他の因果ワールドモデル: インタラクティブで物理意識的なロールアウト安定性が主な要件なら、オートレグレッシブ・行動条件付き状態予測を使用するモデルを探してください。プロンプト完結型ビデオ合成とは異なります。
  • 学習モデル外の物理重視シミュレーションアプローチ: 明示的なルールによるメカニスティックシミュレーションが必要なら、伝統的な物理エンジンやルールベースシミュレータが代替ですが、ダイナミクス生成方法(明示モデル vs 学習次状態予測)が異なります。