Odyssey-2 Max

Odyssey-2 Max 是什么？

Odyssey-2 Max 是一种通用世界模型，旨在模拟世界随时间演化的方式。它从真实世界动作的视觉观察中学习，并使用下一状态预测生成交互式、因果 rollout——旨在支持开放式未来，而非固定、提示界定的视频生成。

核心目标是模拟动态中的物理精度。该页面指出，Odyssey-2 Max 在世界模型的物理精度上推进了最先进水平，并报告了物理相关评估的基准结果。

交互式 rollout 的因果下一状态预测： Odyssey-2 Max 被描述为自回归世界模型，根据先前状态和动作预测每个状态，从而在动作变化时实现实时演化。
rollout 过程中的物理焦点稳定性： 该模型学习动态以逐步保持连贯，减少 rollout 进行中出现的漂移或崩溃。
视觉-动作训练信号（非文本压缩运动）： 该页面强调直接基于真实世界动作的视觉观察进行训练，与从文本反射中学习的方法不同。
扩展模型规模提升物理指标： 该页面报告 Odyssey-2 Max 约为 Odyssey-2 Pro 的 3 倍规模，并显示随着规模增加的更高物理基准分数。
物理保真度基准评估： 它引用了 VBench 2（包括物理子分数）和 Physical AI (PAI) 基准的物理子集结果。

提供的页面更多是概念性描述 Odyssey-2 Max，而非逐步产品界面。根据所述架构和评估框架，典型工作流程包括：

如果您将其与双向视频方法比较，该页面指出 Odyssey-2 Max 的适用性在于因果、交互式预测，而非提示固定的过去/现在/未来生成。

研究原型中的物理保真模拟： 从事物理动态的团队可以使用 Odyssey-2 Max 生成涉及力学、热学和材料的场景的逐步未来状态（参考 VBench 2 物理子分数）。
动作条件规划场景： 由于模型被描述为“随动作实时演化”，它适用于后续决策影响模拟未来结果的工作流程。
机器人与控制概念测试： 该页面将机器人列为目标应用领域，与在动作变化下需要稳定、因果下一状态预测的需求一致。
游戏与交互环境： 对于需要随玩家/代理动作连贯演化的交互设置，因果 rollout 框架直接匹配。
模型比较与基准测试： 研究人员可以使用报告的 VBench 2 和 PAI-Bench 物理分数比较不同模型家族的世界模型物理性能。

Odyssey-2 Max 是双向视频模型吗？
否。该页面将世界模型与双向视频模型（以 Sora、Veo、Kling 和 Runway 为例）进行对比，并说明那些方法从预先固定的提示中联合生成过去/现在/未来，从而限制了实时交互。

什么使其成为“世界模型”而非通用文本/视频生成器？
该页面将世界模型定位为多模态系统，通过因果、交互式 rollout 学习模拟开放式未来。描述的关键区别是基于随时间动作条件的下一状态预测。

页面如何评估物理精度？
它引用了在 VBench 2 上的评估，使用物理子分数（涵盖力学、热学、材料和多视图一致性），以及在 PAI-Bench 的物理建模子集上的评估。

页面上的“实时”是什么意思？
该页面声明“每项模拟均实时生成”，并包含比较表，显示 Odyssey-2 Max 和 Odyssey-2 Pro 的生成时间（例如 120+ 秒生成）。未进一步指定产品级“实时”的确切定义，仅限于此框架。

模型质量是否随规模提升而改善？
该页面报告 Odyssey-2 Max（约为 Odyssey-2 Pro 的 3 倍规模）在 VBench 2 和 PAI-Bench 上提升了物理分数，并将其归因于因果训练下下一状态预测产生的更一致动态。

双向视频模型（提示固定生成）： 如页面所述，这些从固定提示联合生成过去/现在/未来，且不支持同等方式的因果、动作条件交互。
其他针对下一状态预测优化的因果世界模型： 如果您的主要需求是交互式、物理感知的 rollout 稳定性，请寻找使用自回归、动作条件状态预测而非提示完整视频合成的模型。
学习模型之外的物理专注模拟方法： 如果您特别需要带有显式规则的机理模拟，替代方案是传统物理引擎或基于规则的模拟器，尽管它们在动态生成方式上不同（显式建模 vs 学习下一状态预测）。