UStackUStack
Luma icon

Luma

API Luma UNI-1.1 — генерация изображений с приоритетом рассуждений: два endpoint для интерпретации намерения и рендеринга вывода.

Luma

Что такое Luma?

API Luma UNI-1.1 — это интерфейс модели рассуждений для команд, которые хотят генерировать и модифицировать изображения через API-воркфлоу, а не эксперименты промпт за промптом. Модель интерпретирует намерение перед генерацией вывода, чтобы улучшить результаты с первого раза и сократить итерации.

API представлен как инфраструктура, ориентированная на продакшн, с двумя endpoint — одним для рассуждений и одним для генерации, — чтобы приложения могли задавать стиль и композицию вывода, а затем производить изображения или правки. Также поддерживается usage-based billing для Build и provisioned throughput для Scaling.

Ключевые возможности

  • Двухэтапный workflow (рассуждения + генерация): Один endpoint для рассуждений и один для генерации разделяют «мышление» и рендеринг вывода.
  • Генерация с направлением по намерению и референсам: До девяти референсов за ход для направления генерации, поддерживая воспроизводимые workflows.
  • Структурированная логика сцены до пикселей: Возможности вроде интеллектуальной композиции, логики сцены и пространственных рассуждений обрабатываются структурно перед рендерингом изображения.
  • Генерация, ориентированная на правки: Workflow, предназначенный для поддержки модификации промптов на уровне предложений с сохранением существующей структуры «по умолчанию».
  • Многоязычный и последовательный рендеринг: Многоязычный рендеринг и последовательность персонажей/продуктов в разных сценах, позах и рынках представлены как ключевые возможности.
  • Инструменты для разработчиков: Поддержка SDK Python и JavaScript/TS (также упоминаются Go SDKs & CLI), плюс API explorer и документация для оценки.

Как использовать Luma

  1. Ознакомьтесь с документацией UNI-1.1 API и API explorer, чтобы понять flow рассуждений/генерации и паттерны ввода.
  2. Вызовите endpoint рассуждений с вашим намерением и (при необходимости) референсами, чтобы получить направленный план вывода.
  3. Вызовите endpoint генерации, чтобы отрендерить финальное(ые) изображение(я), используя структурированное направление из шага рассуждений.
  4. Начните с usage-based планов Build, чтобы оценить качество вывода по тарифам pay-as-you-go, затем перейдите на provisioned throughput, если нужны гарантированная латентность и ёмкость.

Сценарии использования

  • Брендовые системы для мультистраничного или мультикампанийного креатива: Генерируйте изображения, обновляющиеся по продуктовым страницам и маркетинговым кампаниям скоординированно, включая обработку «грязных или цепных промптов» без кастомного middleware.
  • Продакшн-пайплайны с меньшим числом ретраев: Используйте подход рассуждений-перед-рендерингом, чтобы сократить количество попыток регенерации для достижения приемлемого первого прохода.
  • Кросс-рынковый креатив в масштабе: Производите выводы по разным рынкам с сохранением последовательности персонажей и продуктов в сценах и позах.
  • Вариация контента с структурированным направлением: Используйте до девяти референсов за генерацию, чтобы сохранить композицию и исполнение согласованными по нескольким кадрам.
  • Workflows модификации изображений: Применяйте правки на уровне предложений с сохранением существующей структуры, чтобы итерировать концепцию изображения без старта с нуля.

FAQ

  • Сколько endpoint использует UNI-1.1? Luma описывает два endpoint: один для рассуждений и один для генерации.

  • Сколько референсов можно использовать за генерацию? На странице указано до девяти референсов за ход.

  • Какие варианты программирования поддерживаются? На странице упоминаются SDK Python и JavaScript/TS, а также Go SDKs & CLI.

  • Биллинг usage-based или capacity-based? Указаны usage-based billing для Build (оплата за изображение) и provisioned throughput для Scaling (выделенная ёмкость с гарантированным throughput и латентностью).

  • Есть ли планы для ранней оценки vs продакшн-шкейлинга? Да. Страница разделяет Build (оценка без листинга ожидания) и Scaling (provisioned throughput с повышенными лимитами и поддержкой продакшна).

Альтернативы

  • Другие API генерации изображений с прямыми рабочими процессами текст-в-изображение: Они обычно объединяют «мышление» и рендеринг в один шаг; UNI-1.1 выделяется явным разделением рассуждений и генерации, а также поддержкой workflow с опорой на референс.
  • Универсальные платформы мультимодальной генерации: Платформы, предлагающие генерацию изображений плюс инструменты, могут использоваться для похожих задач вывода, но UNI-1.1 ориентирована на структурированные рассуждения и API-интеграцию для production-пайплайнов.
  • Фреймворки автоматизации промптов и кастомные пайплайны: Вместо дизайна с двумя endpoint для рассуждений/генерации некоторые команды строят собственную оркестрацию и логику повторов; UNI-1.1 подчёркивает снижение нужды в middleware для chaining промптов и правок.
  • Сервисы рендеринга изображений на GPU по запросу: Для команд, сосредоточенных прежде всего на рендеринге в масштабе, сервисы с приоритетом рендеринга могут подойти, в то время как UNI-1.1 акцентирует направление и улучшение результатов первого прохода через рассуждения перед генерацией пикселей.

Альтернативы

exactly.ai icon

exactly.ai

exactly.ai — AI-генератор изображений и креативная студия для команд: копируйте визуальный стиль бренда, создавайте вариации и сохраняйте приватность.

PXZ AI icon

PXZ AI

Все-в-одном AI платформа, которая объединяет инструменты для изображения, видео, голоса, письма и чата для повышения креативности и сотрудничества.

Pic Copilot icon

Pic Copilot

Преобразите свой интернет-магазин с помощью AI-моделей моды, AI-изображений продуктов и UGC-видео — все в одном инструменте. Не требуются навыки студийной работы или дизайна.

UNI-1 icon

UNI-1

UNI-1 от Luma — мультимодальная модель, генерирующая пиксели. Поддерживает управляемое референс-направленное создание: завершение сцен и трансформации.

GPTIMG2 AI icon

GPTIMG2 AI

GPTIMG2 AI — генератор изображений с фокусом на промпт-уточнение: продуктовые съемки, постеры и маркетинговые визуалы с читаемым текстом.

TapNow icon

TapNow

TapNow — AI-инструмент для создания визуалов для бизнеса и креаторов: от e-commerce ads до кинематографичных коротких фильмов и экспериментального арта.