Luma 是什麼?
Luma 的 UNI-1.1 API 是專為團隊設計的推理模型介面,適合透過 API 工作流程生成與修改影像,而非逐提示實驗。模型會先解析意圖再生成輸出,旨在提升首次結果並減少迭代次數。
此 API 以生產導向基礎設施呈現,包含兩個端點——一個用於推理、一個用於生成——讓應用程式能指定輸出風格與構圖,接著產生影像或編輯。它也支援使用量計費的 Build 方案,以及 Scaling 的預置吞吐量。
主要功能
- 雙端點工作流程(推理 + 生成): 一個推理端點與一個生成端點,將「思考」與輸出渲染分離。
- 參考導向的意圖生成: 每次最多 九個參考 用於導向生成,支援可重現工作流程。
- 像素前結構化場景邏輯: 智慧構圖、場景邏輯與空間推理等功能,在影像渲染前以結構化方式處理。
- 編輯導向生成: 設計用於支援句子層級提示修改,預設保留既有結構。
- 多語言與一致渲染: 多語言渲染,以及跨場景、姿勢與市場的角色/產品一致性,為核心功能。
- 開發者工具: Python 與 JavaScript/TS SDK 支援(另提及 Go SDKs & CLI),另有 API 探索器與文件用於評估。
如何使用 Luma
- 檢閱 UNI-1.1 API 文件與 API 探索器,了解推理/生成流程與輸入模式。
- 呼叫推理端點,輸入意圖與(必要時)參考輸入,產生導向輸出計劃。
- 呼叫生成端點,使用推理步驟的結構化指示渲染最終影像。
- 從使用量計費的 Build 方案開始,以按用量付費評估輸出品質,之後轉向預置吞吐量以確保延遲與容量。
使用案例
- 多頁面或多活動品牌系統創意: 協調生成跨產品頁面與行銷活動的影像,包括處理「混亂或鏈式提示」而無需自訂中介軟體。
- 偏好少重試的生產管線: 採用渲染前推理方式,減少達到滿意首次輸出的再生次數。
- 大規模跨市場創意: 跨不同市場產生輸出,同時維持跨場景與姿勢的角色與產品一致性。
- 結構化導向的內容變化: 每次生成最多使用九個參考,保持多鏡頭的構圖與執行一致。
- 影像修改工作流程: 套用句子層級編輯,保留既有結構,從頭迭代影像概念。
常見問題
-
UNI-1.1 使用多少端點? Luma 描述 兩個端點:一個推理端點與一個生成端點。
-
每次生成可使用多少參考? 頁面指出 每次最多九個參考。
-
支援哪些程式語言選項? 頁面提及 Python 與 JavaScript/TS SDK,並參考 Go SDKs & CLI。
-
計費是使用量基礎還是容量基礎? 列出 Build 的 使用量計費(按影像付費)與 Scaling 的 預置吞吐量(專屬容量,保證吞吐量與延遲)。
-
有早期評估與生產擴展的方案嗎? 有。頁面區分 Build(無等待名單評估)與 Scaling(預置吞吐量,較高速率限制與生產支援)。
替代方案
- 其他具直接文字轉影像工作流程的影像生成 API: 這些通常將「思考」與渲染合併為單一步驟;UNI-1.1 透過明確分離推理與生成,並支援參考導向工作流程而有所區別。
- 通用多模態生成平台: 提供影像生成加上工具的平台可用於類似輸出任務,但 UNI-1.1 定位於結構化推理與基於 API 的生產流程整合。
- 提示自動化框架與自訂管線: 有些團隊不使用雙端點推理/生成設計,而是自行建置協調與重試邏輯;UNI-1.1 強調減少提示鏈接與編輯的中介軟體需求。
- 隨選 GPU 影像渲染服務: 對於專注大規模渲染的團隊,渲染優先服務可能適合,而 UNI-1.1 強調透過推理導向並改善首次輸出結果,再進行像素生成。
替代品
exactly.ai
exactly.ai 提供 AI 影像生成與創意工作室,讓團隊以品牌代表圖學習風格並產出貼合品牌的變體,資料保持私有。
PXZ AI
一個集成圖像、視頻、語音、寫作和聊天工具的全能AI平台,以增強創造力和協作。
Pic Copilot
使用AI時尚模特、AI產品圖片和UGC視頻,全面提升您的電子商務商店。無需專業攝影或設計技能。
UNI-1
UNI-1 是 Luma 的多模態推理模型,可生成像素,支援可指令、參考引導的影像建立,用於場景補全與轉換等任務。
GPTIMG2 AI
GPTIMG2 AI(GPT Image 2)以影像為先的生成器,透過提示詞精修保留主體、版面與海報上可讀文字,用於行銷視覺製作。
TapNow
TapNow 是 AI 原生視覺創作引擎,協助企業與創作者生成專業等級影像,涵蓋電商廣告、短片與實驗藝術。