UStackUStack
Odyssey-2 Max icon

Odyssey-2 Max

Odyssey-2 Max — универсальная world model для предсказания следующего состояния с учетом действий и причинности, с упором на физическую точность и оценкой VBench 2, PAI-Bench.

Odyssey-2 Max

Что такое Odyssey-2 Max?

Odyssey-2 Max — универсальная world model, предназначенная для симуляции эволюции мира во времени. Она обучается на визуальных наблюдениях реальных действий и использует предсказание следующего состояния для создания интерактивных причинно-следственных разверток — с акцентом на открытые будущие сценарии, а не на фиксированную генерацию видео по промпту.

Основная цель — физическая точность в симулированной динамике. На странице указано, что Odyssey-2 Max продвигает передовой уровень физической точности world model и приводит результаты бенчмарков по физике.

Ключевые особенности

  • Причинное предсказание следующего состояния для интерактивных разверток: Odyssey-2 Max представлена как авторегрессионная world model, предсказывающая каждое состояние на основе предыдущих состояний и действий, что позволяет эволюционировать в реальном времени при изменении действий.
  • Физическая стабильность во время разверток: Модель обучается динамике для пошаговой coherentности, снижая дрейф или коллапс по мере продвижения развертки.
  • Визуальный сигнал обучения на действиях (не сжатое текстом движение): На странице подчеркивается обучение напрямую на визуальных наблюдениях реальных действий, в отличие от обучения на текстовых описаниях.
  • Увеличенный размер модели для улучшенных физических метрик: Указано, что Odyssey-2 Max примерно в 3 раза больше Odyssey-2 Pro и показывает более высокие баллы в физических бенчмарках при росте масштаба.
  • Оценка на бенчмарках физической достоверности: Приводятся результаты по VBench 2 (включая подбалл по физике) и физической подвыборке бенчмарка Physical AI (PAI).

Как использовать Odyssey-2 Max

На предоставленной странице Odyssey-2 Max описана концептуально, без пошагового интерфейса продукта. На основе заявленной архитектуры и оценки типичный workflow включает:

  1. Предоставление начального состояния мира и последующих действий (страница подчеркивает развертки с учетом действий и причинности).
  2. Запуск модели для генерации будущих состояний во времени, где каждое следующее состояние предсказывается из предыдущих состояний и действий.
  3. Оценку качества вывода с помощью бенчмарков физической достоверности, указанных на странице (физика VBench 2 и PAI-Bench), особенно если цель — механика и согласованность.

Если сравнивать с bidirectional видео-подходами, страница указывает, что Odyssey-2 Max подходит для причинного интерактивного предсказания, а не для генерации прошлого/настоящего/будущего по фиксированному промпту.

Случаи применения

  • Физически достоверная симуляция для исследовательских прототипов: Команды, работающие с физической динамикой, могут использовать Odyssey-2 Max для пошаговой генерации будущих состояний в сценариях с механикой, термодинамикой и материалами (как указано в подбалле VBench 2 по физике).
  • Сценарии планирования с учетом действий: Поскольку модель эволюционирует «с действиями в реальном времени», она подходит для workflow, где последующие решения влияют на будущие исходы в симуляции.
  • Тестирование концепций робототехники и управления: Страница упоминает робототехнику среди целевых областей, что соответствует потребности в стабильном причинном предсказании следующего состояния при изменяющихся действиях.
  • Игры и интерактивные среды: Для интерактивных сценариев, требующих coherentной эволюции с действиями игрока/агента, причинная развертка — прямое соответствие.
  • Сравнение моделей и бенчмаркинг: Исследователи могут использовать указанные баллы VBench 2 и PAI-Bench по физике для сравнения физической производительности world model между семьями моделей.

Часто задаваемые вопросы

Является ли Odyssey-2 Max двунаправленной видео-моделью?
Нет. На странице проводится сравнение world models с двунаправленными видео-моделями (приводятся примеры Sora, Veo, Kling и Runway), где указано, что такие подходы генерируют прошлое/настоящее/будущее совместно из заранее фиксированного промпта, что ограничивает взаимодействие в реальном времени.

Что делает её «world model», а не универсальным генератором текста/видео?
Страница позиционирует world models как мультимодальные системы, которые учатся симулировать открытые будущие сценарии через причинные, интерактивные размотки. Ключевое отличие — предсказание следующего состояния, обусловленное действиями во времени.

Как на странице оценивается физическая точность?
Указывается оценка на VBench 2 с подоценкой по физике (механика, термодинамика, материалы и согласованность с нескольких ракурсов), а также на подмножестве physics modelling из PAI-Bench.

Что значит «real-time» на этой странице?
На странице указано, что «каждый симулированный ролик генерировался в реальном времени», и приведена сравнительная таблица с временем генерации (например, 120+ секунд) для Odyssey-2 Max и Odyssey-2 Pro. Точное определение «real time» на уровне продукта не уточняется сверх этой формулировки.

Улучшается ли качество модели с масштабом?
Страница сообщает, что Odyssey-2 Max (примерно в 3 раза больше Odyssey-2 Pro) улучшила физические баллы на VBench 2 и PAI-Bench, приписывая это более последовательной динамике, возникающей из предсказания следующего состояния при причинном обучении.

Альтернативы

  • Двунаправленные видео-модели (генерация с фиксированным промптом): Как описано на странице, они совместно генерируют прошлое/настоящее/будущее из фиксированного промпта и не поддерживают причинное взаимодействие, обусловленное действиями, аналогичным образом.
  • Другие причинные world models, оптимизированные для предсказания следующего состояния: Если ключевой потребностью является стабильность интерактивных, физически осведомленных размоток, ищите модели, использующие авторегрессивное предсказание состояния, обусловленное действиями, а не синтез полного видео по промпту.
  • Подходы к физике-ориентированной симуляции вне обученных моделей: Если нужны механистические симуляции с явными правилами, альтернативы — традиционные физические движки или симуляторы на основе правил, хотя они отличаются способом генерации динамики (явное моделирование vs обученное предсказание следующего состояния).
Odyssey-2 Max | UStack