UStackUStack
Luma icon

Luma

Luma 的 UNI-1.1 API 是以推理為先的影像生成介面,提供兩個端點處理意圖解析與輸出渲染,支援生產流程。

Luma

Luma 是什麼?

Luma 的 UNI-1.1 API 是專為團隊設計的推理模型介面,適合透過 API 工作流程生成與修改影像,而非逐提示實驗。模型會先解析意圖再生成輸出,旨在提升首次結果並減少迭代次數。

此 API 以生產導向基礎設施呈現,包含兩個端點——一個用於推理、一個用於生成——讓應用程式能指定輸出風格與構圖,接著產生影像或編輯。它也支援使用量計費的 Build 方案,以及 Scaling 的預置吞吐量。

主要功能

  • 雙端點工作流程(推理 + 生成): 一個推理端點與一個生成端點,將「思考」與輸出渲染分離。
  • 參考導向的意圖生成: 每次最多 九個參考 用於導向生成,支援可重現工作流程。
  • 像素前結構化場景邏輯: 智慧構圖、場景邏輯與空間推理等功能,在影像渲染前以結構化方式處理。
  • 編輯導向生成: 設計用於支援句子層級提示修改,預設保留既有結構。
  • 多語言與一致渲染: 多語言渲染,以及跨場景、姿勢與市場的角色/產品一致性,為核心功能。
  • 開發者工具: PythonJavaScript/TS SDK 支援(另提及 Go SDKs & CLI),另有 API 探索器與文件用於評估。

如何使用 Luma

  1. 檢閱 UNI-1.1 API 文件與 API 探索器,了解推理/生成流程與輸入模式。
  2. 呼叫推理端點,輸入意圖與(必要時)參考輸入,產生導向輸出計劃。
  3. 呼叫生成端點,使用推理步驟的結構化指示渲染最終影像。
  4. 從使用量計費的 Build 方案開始,以按用量付費評估輸出品質,之後轉向預置吞吐量以確保延遲與容量。

使用案例

  • 多頁面或多活動品牌系統創意: 協調生成跨產品頁面與行銷活動的影像,包括處理「混亂或鏈式提示」而無需自訂中介軟體。
  • 偏好少重試的生產管線: 採用渲染前推理方式,減少達到滿意首次輸出的再生次數。
  • 大規模跨市場創意: 跨不同市場產生輸出,同時維持跨場景與姿勢的角色與產品一致性。
  • 結構化導向的內容變化: 每次生成最多使用九個參考,保持多鏡頭的構圖與執行一致。
  • 影像修改工作流程: 套用句子層級編輯,保留既有結構,從頭迭代影像概念。

常見問題

  • UNI-1.1 使用多少端點? Luma 描述 兩個端點:一個推理端點與一個生成端點。

  • 每次生成可使用多少參考? 頁面指出 每次最多九個參考

  • 支援哪些程式語言選項? 頁面提及 PythonJavaScript/TS SDK,並參考 Go SDKs & CLI

  • 計費是使用量基礎還是容量基礎? 列出 Build 的 使用量計費(按影像付費)與 Scaling 的 預置吞吐量(專屬容量,保證吞吐量與延遲)。

  • 有早期評估與生產擴展的方案嗎? 有。頁面區分 Build(無等待名單評估)與 Scaling(預置吞吐量,較高速率限制與生產支援)。

替代方案

  • 其他具直接文字轉影像工作流程的影像生成 API: 這些通常將「思考」與渲染合併為單一步驟;UNI-1.1 透過明確分離推理與生成,並支援參考導向工作流程而有所區別。
  • 通用多模態生成平台: 提供影像生成加上工具的平台可用於類似輸出任務,但 UNI-1.1 定位於結構化推理與基於 API 的生產流程整合。
  • 提示自動化框架與自訂管線: 有些團隊不使用雙端點推理/生成設計,而是自行建置協調與重試邏輯;UNI-1.1 強調減少提示鏈接與編輯的中介軟體需求。
  • 隨選 GPU 影像渲染服務: 對於專注大規模渲染的團隊,渲染優先服務可能適合,而 UNI-1.1 強調透過推理導向並改善首次輸出結果,再進行像素生成。