UStackUStack
Luma icon

Luma

A API UNI-1.1 da Luma é uma interface de geração de imagens com foco em raciocínio, com dois endpoints para interpretação de intenção e renderização.

Luma

O que é Luma?

A API UNI-1.1 da Luma é uma interface de modelo de raciocínio para equipes que desejam gerar e modificar imagens por meio de um fluxo de trabalho de API, em vez de experimentação prompt por prompt. O modelo interpreta a intenção antes de gerar a saída, visando melhorar os resultados na primeira tentativa e reduzir iterações.

A API é apresentada como infraestrutura orientada para produção, com dois endpoints — um para raciocínio e um para geração —, permitindo que aplicativos direcionem estilo e composição de saída e depois produzam imagens ou edições. Ela também suporta cobrança baseada em uso para Build e throughput provisionado para Scaling.

Principais Recursos

  • Fluxo de trabalho de dois endpoints (raciocínio + geração): Um endpoint de raciocínio e um de geração separam o “pensamento” da renderização de saída.
  • Geração direcionada por intenção com referências: Até nove referências por turno para direcionar a geração, suportando fluxos de trabalho reproduzíveis.
  • Lógica de cena estruturada antes dos pixels: Capacidades como composição inteligente, lógica de cena e raciocínio espacial são tratadas estruturalmente antes da renderização da imagem.
  • Geração orientada para edição: Um fluxo de trabalho projetado para suportar modificações de prompts por edições em nível de frase, preservando a estrutura existente “por padrão”.
  • Renderização multilíngue e consistente: Renderização multilíngue e consistência de personagens/produtos em cenas, poses e mercados são apresentadas como capacidades principais.
  • Ferramentas para desenvolvedores: Suporte a SDKs de Python e JavaScript/TS (também mencionado: Go SDKs & CLI), além de explorador de API e documentação para avaliação.

Como Usar Luma

  1. Consulte a documentação da API UNI-1.1 e o explorador de API para entender o fluxo de raciocínio/geração e padrões de entrada.
  2. Chame o endpoint de raciocínio com sua intenção e (quando necessário) entradas de referência para produzir um plano de saída guiado.
  3. Chame o endpoint de geração para renderizar a(s) imagem(ns) final(is), usando a direção estruturada da etapa de raciocínio.
  4. Comece com planos Build baseados em uso para avaliar a qualidade da saída em taxas pay-as-you-go, depois migre para throughput provisionado se precisar de latência e capacidade garantidas.

Casos de Uso

  • Sistemas de marca para criativos multipágina ou multicampanha: Gere imagens que se atualizam em páginas de produto e campanhas de marketing de forma coordenada, incluindo tratamento de “prompts bagunçados ou encadeados” sem middleware personalizado.
  • Pipelines de produção que preferem menos retentativas: Use uma abordagem de raciocínio antes da renderização para reduzir o número de tentativas de regeneração necessárias para uma primeira passada aceitável.
  • Criativos cross-market em escala: Produza saídas em diferentes mercados mantendo consistência de personagens e produtos em cenas e poses.
  • Variação de conteúdo com direção estruturada: Use até nove referências por geração para manter composição e execução alinhadas em múltiplos takes.
  • Fluxos de trabalho de modificação de imagem: Aplique edições em nível de frase preservando a estrutura existente para iterar em um conceito de imagem sem começar do zero.

FAQ

  • Quantos endpoints a UNI-1.1 usa? A Luma descreve dois endpoints: um de raciocínio e um de geração.

  • Quantas referências posso usar por geração? A página afirma até nove referências por turno.

  • Quais opções de programação são suportadas? A página menciona SDKs de Python e JavaScript/TS, e também refere Go SDKs & CLI.

  • A cobrança é baseada em uso ou capacidade? Lista cobrança baseada em uso para Build (pague por imagem) e throughput provisionado para Scaling (capacidade dedicada com throughput e latência garantidos).

  • Há planos para avaliação inicial versus escalonamento de produção? Sim. A página separa Build (avalie sem lista de espera) de Scaling (throughput provisionado com limites de taxa mais altos e suporte de produção).

Alternativas

  • Outras APIs de geração de imagens com fluxos diretos de texto para imagem: Essas geralmente combinam “pensamento” e renderização em uma única etapa; a UNI-1.1 se diferencia ao separar explicitamente o raciocínio e a geração e ao suportar um fluxo de trabalho direcionado por referência.
  • Plataformas de geração multimodal de uso geral: Plataformas que oferecem geração de imagens mais ferramentas podem ser usadas para tarefas de saída semelhantes, mas a UNI-1.1 é posicionada em torno de raciocínio estruturado e integração baseada em API para pipelines de produção.
  • Frameworks de automação de prompts e pipelines personalizados: Em vez de usar um design de dois endpoints para raciocínio/geração, algumas equipes constroem sua própria orquestração e lógica de retry; a UNI-1.1 enfatiza a redução da necessidade de middleware para encadeamento e edições de prompts.
  • Serviços de renderização de imagens em GPU sob demanda: Para equipes focadas principalmente em renderização em escala, serviços com prioridade em renderização podem se adequar, enquanto a UNI-1.1 enfatiza direcionar e melhorar resultados de primeira passagem via raciocínio antes da geração de pixels.