Nano Banana 2 是什麼?
Nano Banana 2 是 Google DeepMind 最新的圖像生成模型,以「Gemini 3.1 Flash Image」形式推出。它結合 Nano Banana Pro 的進階能力與 Gemini Flash 的速度,實現更快速的圖像生成以及更快的編修與迭代。
根據 Google,Nano Banana 2 正在 Gemini 應用程式、Google 搜尋和 Ads 等 Google 產品中推出。該模型定位於提供更高品質輸出,並具備維持主體一致性和更嚴格遵循複雜指示的功能。
主要功能
- Gemini 真實世界知識驅動的進階世界知識:模型利用 Gemini 的知識庫,並透過網路搜尋的即時資訊與圖像,更精準呈現特定主體。
- 強化主體一致性的創作控制:模型支援單一工作流程中最多五個角色的相似度,以及最多 14 個物件的保真度,幫助在建構序列或敘事時維持編修間的外觀一致。
- 圖像內精準文字渲染與翻譯:Nano Banana 2 可為行銷模擬或賀卡等資產生成準確易讀文字,並能在圖像內進行本地化/翻譯。
- 改善指示遵循:Google 表示,模型更嚴格遵守複雜請求,包括想法的細微細節,以更符合使用者需求。
- 多尺寸生產就緒圖像規格:使用者可控制從 512px 到 4K 的長寬比與解析度,支援垂直社群貼文或寬螢幕背景等格式。
- Flash 速度下的視覺保真度提升:Google 描述具備更豐富紋理、更銳利細節與鮮豔光影,同時維持 Flash 預期的速度。
如何使用 Nano Banana 2
首先,透過已上線的 Google 產品存取 Nano Banana 2(Google 表示正在 Gemini、Search 和 Ads 推出)。輸入描述主體、風格與期望變更的提示語。若需序列中一致的角色或物件,請在提示中包含這些元素,並指定場景演進方式。
對於行銷或溝通資產,使用需具可讀文字或本地化/翻譯文字的提示,並指定特定長寬比或解析度(視可用性),以符合預期放置位置。
使用案例
- 從筆記建立資訊圖表與圖解:使用提示將主題轉為結構化視覺(例如生成水循環資訊圖),利用模型的世界知識精準呈現特定主體。
- 生成具易讀圖內文字的行銷模擬:要求準確文字用於標誌或促銷圖形,再生成不同長寬比版本以適用不同位置。
- 為全球受眾本地化圖像內容:要求模型翻譯並本地化圖像內文字,讓視覺可跨語言重複使用。
- 具一致角色的故事板式工作流程:對於多畫格敘事,指定最多五個角色相似度與最多 14 個物件,以維持角色與關鍵項目在編修間的一致外觀。
- 具控制格式規格的廣告或活動資產:透過選擇 512px 到 4K 的長寬比與解析度,快速產生符合常見創作需求的視覺,並依提示精煉迭代。
常見問題
-
可在哪裡存取 Nano Banana 2? Google 表示正在 Gemini 應用程式、Google 搜尋 和 Ads 等 Google 產品中推出。
-
此處「Flash 速度」指的是什麼? 頁面描述 Nano Banana 2 結合 Nano Banana Pro 能力與 Gemini Flash 的速度,實現更快圖像生成與更快速編修迭代。
-
它能在編修間維持角色或物件一致嗎? 可以。Google 表示支援單一工作流程中 最多五個角色相似度 與 最多 14 個物件保真度。
-
它能生成圖內易讀文字並翻譯嗎? Google 表示能為行銷模擬或賀卡產生 精準文字渲染,並能 翻譯/本地化圖像內文字。
-
它支援哪些輸出尺寸? 模型支援從 512px 到 4K 的多種長寬比與解析度。
替代方案
- 其他 AI 圖像生成模型:AI 圖像生成類別中的許多工具都能從提示詞產生圖像,但可能在遵循指示的一致性、主體保真度或文字渲染上有所差異。
- 使用生成 + 內繪/外繪的圖像編輯工作流程:對於專注迭代精煉的使用者,以編輯為先的方法(先生成,再選擇性修訂部分)可作為替代方案,雖然可能需要更多手動步驟來維持角色/物件一致性。
- 具人工可編輯文字的範本設計工具:若可讀文字與本地化為主要需求,範本式工作流程可透過保持排版可編輯,減少對模型文字渲染的依賴—但代價是視覺整合較不無縫。
- 通用創意套件:對於重視版面、排版與資產管理的製作流程,創意套件可在圖像生成後,補充處理最終設計與格式化。
替代品
PXZ AI
一個集成圖像、視頻、語音、寫作和聊天工具的全能AI平台,以增強創造力和協作。
Pic Copilot
使用AI時尚模特、AI產品圖片和UGC視頻,全面提升您的電子商務商店。無需專業攝影或設計技能。
exactly.ai
exactly.ai 提供 AI 影像生成與創意工作室,讓團隊以品牌代表圖學習風格並產出貼合品牌的變體,資料保持私有。
GPTIMG2 AI
GPTIMG2 AI(GPT Image 2)以影像為先的生成器,透過提示詞精修保留主體、版面與海報上可讀文字,用於行銷視覺製作。
TapNow
TapNow 是 AI 原生視覺創作引擎,協助企業與創作者生成專業等級影像,涵蓋電商廣告、短片與實驗藝術。
Hotpot.ai
Hotpot.ai 是 AI 影像與 AI 頭像平台,可生成圖片、編輯照片(放大、去背等),也提供 AI 寫作與圖形模板。