UStackUStack
Odyssey-2 Max icon

Odyssey-2 Max

Odyssey-2 Max 通用世界模型,支持因果、动作条件的下一状态预测,模拟开放式未来并强调更高物理精度,基于 VBench 2、PAI-Bench 评测。

Odyssey-2 Max

Odyssey-2 Max 是什么?

Odyssey-2 Max 是一种通用世界模型,旨在模拟世界随时间演化的方式。它从真实世界动作的视觉观察中学习,并使用下一状态预测生成交互式、因果 rollout——旨在支持开放式未来,而非固定、提示界定的视频生成。

核心目标是模拟动态中的物理精度。该页面指出,Odyssey-2 Max 在世界模型的物理精度上推进了最先进水平,并报告了物理相关评估的基准结果。

主要特性

  • 交互式 rollout 的因果下一状态预测: Odyssey-2 Max 被描述为自回归世界模型,根据先前状态和动作预测每个状态,从而在动作变化时实现实时演化。
  • rollout 过程中的物理焦点稳定性: 该模型学习动态以逐步保持连贯,减少 rollout 进行中出现的漂移或崩溃。
  • 视觉-动作训练信号(非文本压缩运动): 该页面强调直接基于真实世界动作的视觉观察进行训练,与从文本反射中学习的方法不同。
  • 扩展模型规模提升物理指标: 该页面报告 Odyssey-2 Max 约为 Odyssey-2 Pro 的 3 倍规模,并显示随着规模增加的更高物理基准分数。
  • 物理保真度基准评估: 它引用了 VBench 2(包括物理子分数)和 Physical AI (PAI) 基准的物理子集结果。

如何使用 Odyssey-2 Max

提供的页面更多是概念性描述 Odyssey-2 Max,而非逐步产品界面。根据所述架构和评估框架,典型工作流程包括:

  1. 提供初始世界状态和后续动作(页面强调动作条件、因果 rollout)。
  2. 运行模型生成随时间演化的未来状态,其中每个下一状态基于先前状态和动作预测。
  3. 使用页面引用的物理保真度基准(VBench 2 物理和 PAI-Bench 物理)评估输出质量,特别是如果您的目标是力学和一致性。

如果您将其与双向视频方法比较,该页面指出 Odyssey-2 Max 的适用性在于因果、交互式预测,而非提示固定的过去/现在/未来生成。

使用场景

  • 研究原型中的物理保真模拟: 从事物理动态的团队可以使用 Odyssey-2 Max 生成涉及力学、热学和材料的场景的逐步未来状态(参考 VBench 2 物理子分数)。
  • 动作条件规划场景: 由于模型被描述为“随动作实时演化”,它适用于后续决策影响模拟未来结果的工作流程。
  • 机器人与控制概念测试: 该页面将机器人列为目标应用领域,与在动作变化下需要稳定、因果下一状态预测的需求一致。
  • 游戏与交互环境: 对于需要随玩家/代理动作连贯演化的交互设置,因果 rollout 框架直接匹配。
  • 模型比较与基准测试: 研究人员可以使用报告的 VBench 2 和 PAI-Bench 物理分数比较不同模型家族的世界模型物理性能。

常见问题

Odyssey-2 Max 是双向视频模型吗?
否。该页面将世界模型与双向视频模型(以 Sora、Veo、Kling 和 Runway 为例)进行对比,并说明那些方法从预先固定的提示中联合生成过去/现在/未来,从而限制了实时交互。

什么使其成为“世界模型”而非通用文本/视频生成器?
该页面将世界模型定位为多模态系统,通过因果、交互式 rollout 学习模拟开放式未来。描述的关键区别是基于随时间动作条件的下一状态预测。

页面如何评估物理精度?
它引用了在 VBench 2 上的评估,使用物理子分数(涵盖力学、热学、材料和多视图一致性),以及在 PAI-Bench 的物理建模子集上的评估。

页面上的“实时”是什么意思?
该页面声明“每项模拟均实时生成”,并包含比较表,显示 Odyssey-2 Max 和 Odyssey-2 Pro 的生成时间(例如 120+ 秒生成)。未进一步指定产品级“实时”的确切定义,仅限于此框架。

模型质量是否随规模提升而改善?
该页面报告 Odyssey-2 Max(约为 Odyssey-2 Pro 的 3 倍规模)在 VBench 2 和 PAI-Bench 上提升了物理分数,并将其归因于因果训练下下一状态预测产生的更一致动态。

替代方案

  • 双向视频模型(提示固定生成): 如页面所述,这些从固定提示联合生成过去/现在/未来,且不支持同等方式的因果、动作条件交互。
  • 其他针对下一状态预测优化的因果世界模型: 如果您的主要需求是交互式、物理感知的 rollout 稳定性,请寻找使用自回归、动作条件状态预测而非提示完整视频合成的模型。
  • 学习模型之外的物理专注模拟方法: 如果您特别需要带有显式规则的机理模拟,替代方案是传统物理引擎或基于规则的模拟器,尽管它们在动态生成方式上不同(显式建模 vs 学习下一状态预测)。
Odyssey-2 Max | UStack