UStackUStack
Luma icon

Luma

Luma의 UNI-1.1 API는 의도 해석과 출력 렌더링을 분리한 추론 우선 이미지 생성 인터페이스로, 프로덕션 파이프라인에 최적화

Luma

Luma란 무엇인가요?

Luma의 UNI-1.1 API는 프롬프트별 실험 대신 API 워크플로를 통해 이미지를 생성하고 수정하고자 하는 팀을 위한 추론 모델 인터페이스입니다. 모델은 출력을 생성하기 전에 의도를 해석하여 첫 번째 시도 결과를 개선하고 반복을 줄이는 것을 목표로 합니다.

API는 프로덕션 지향 인프라로 제시되며, 추론용과 생성용 두 엔드포인트를 제공합니다. 이를 통해 애플리케이션은 출력 스타일과 구성을 지시한 후 이미지나 편집을 생성할 수 있습니다. 또한 Build를 위한 사용량 기반 과금과 Scaling을 위한 프로비저닝된 처리량을 지원합니다.

주요 기능

  • 두 엔드포인트 워크플로 (추론 + 생성): 추론 엔드포인트 하나와 생성 엔드포인트 하나로 “생각”과 출력 렌더링을 분리합니다.
  • 참조를 통한 의도 지향 생성: 생성 지시를 위한 턴당 최대 9개의 참조를 지원하여 재현 가능한 워크플로를 가능하게 합니다.
  • 픽셀 이전의 구조화된 장면 로직: 지능형 구성, 장면 로직, 공간 추론 등의 기능이 이미지 렌더링 전에 구조적으로 처리됩니다.
  • 편집 지향 생성: 기존 구조를 “기본적으로” 보존하면서 문장 수준 편집으로 프롬프트를 수정하는 워크플로를 지원합니다.
  • 다국어 및 일관된 렌더링: 다국어 렌더링과 장면, 포즈, 시장 간 캐릭터/제품 일관성을 핵심 기능으로 제시합니다.
  • 개발자 도구: PythonJavaScript/TS SDK 지원 (또한 Go SDKs & CLI 언급), API 탐색기와 문서를 통한 평가 지원.

Luma 사용 방법

  1. UNI-1.1 API 문서와 API 탐색기 검토하여 추론/생성 흐름과 입력 패턴을 이해합니다.
  2. 추론 엔드포인트 호출하여 의도와 (필요 시) 참조 입력으로 안내 출력 계획을 생성합니다.
  3. 생성 엔드포인트 호출하여 추론 단계의 구조화된 지침을 사용해 최종 이미지(들)를 렌더링합니다.
  4. 사용량 기반 Build 플랜으로 시작하여 종량제 요율로 출력 품질을 평가한 후, 보장된 지연 시간과 용량이 필요하면 프로비저닝된 처리량으로 전환합니다.

사용 사례

  • 다중 페이지 또는 다중 캠페인 크리에이티브를 위한 브랜드 시스템: 사용자 정의 미들웨어 없이 “복잡하거나 체인된 프롬프트”를 처리하며 제품 페이지와 마케팅 캠페인 전반에 걸쳐 조정된 이미지를 생성합니다.
  • 재시도 횟수를 최소화하는 프로덕션 파이프라인: 렌더링 전 추론 접근으로 수용 가능한 첫 번째 시도에 도달하기 위한 재생성 시도를 줄입니다.
  • 대규모 크로스 마켓 크리에이티브: 장면과 포즈 간 캐릭터 및 제품 일관성을 유지하며 다양한 시장에 대한 출력을 생성합니다.
  • 구조화된 지침을 통한 콘텐츠 변형: 여러 샷 간 구성과 실행을 일치시키기 위해 생성당 최대 9개의 참조를 사용합니다.
  • 이미지 수정 워크플로: 기존 구조를 보존하면서 문장 수준 편집을 적용하여 이미지 컨셉을 처음부터 다시 시작하지 않고 반복합니다.

자주 묻는 질문

  • UNI-1.1은 몇 개의 엔드포인트를 사용하나요? Luma는 두 엔드포인트를 설명합니다: 추론 엔드포인트 하나와 생성 엔드포인트 하나.

  • 생성당 몇 개의 참조를 사용할 수 있나요? 페이지에 따르면 턴당 최대 9개의 참조입니다.

  • 어떤 프로그래밍 옵션이 지원되나요? 페이지에서 PythonJavaScript/TS SDK를 언급하며, Go SDKs & CLI도 참조합니다.

  • 과금이 사용량 기반인가 용량 기반인가요? Build의 사용량 기반 과금 (이미지당 결제)과 Scaling의 프로비저닝된 처리량 (보장된 처리량과 지연 시간의 전용 용량)을 나열합니다.

  • 초기 평가와 프로덕션 스케일링을 위한 플랜이 있나요? 네. 페이지에서 Build (대기 목록 없이 평가)와 Scaling (더 높은 속도 제한과 프로덕션 지원의 프로비저닝된 처리량)을 구분합니다.

대안

  • 직접 텍스트-이미지 워크플로를 가진 다른 이미지 생성 API: 이러한 API는 일반적으로 “추론”과 렌더링을 단일 단계로 결합합니다. UNI-1.1은 추론과 생성을 명시적으로 분리하고 참조 지향 워크플로를 지원함으로써 차별화됩니다.
  • 범용 멀티모달 생성 플랫폼: 이미지 생성과 도구를 제공하는 플랫폼은 유사한 출력 작업에 사용될 수 있지만, UNI-1.1은 구조화된 추론과 프로덕션 파이프라인을 위한 API 기반 통합에 초점을 맞춥니다.
  • 프롬프트 자동화 프레임워크 및 커스텀 파이프라인: 2-엔드포인트 추론/생성 설계를 사용하는 대신, 일부 팀은 자체 오케스트레이션과 재시도 로직을 구축합니다. UNI-1.1은 프롬프트 체이닝과 편집을 위한 미들웨어 필요성을 줄이는 데 중점을 둡니다.
  • 주문형 GPU 이미지 렌더링 서비스: 주로 대규모 렌더링에 초점을 맞춘 팀에게는 렌더링 우선 서비스가 적합할 수 있으며, UNI-1.1은 픽셀 생성 전에 추론을 통해 첫 번째 패스 결과를 지시하고 개선하는 데 중점을 둡니다.