Nano Banana 2 是什么?
Nano Banana 2 是 Google DeepMind 的最新图像生成模型,以“Gemini 3.1 Flash Image”形式发布。它旨在结合 Nano Banana Pro 的高级能力与 Gemini Flash 的速度,实现更快的图像生成以及更迅捷的编辑和迭代。
据 Google 介绍,Nano Banana 2 正在 Gemini 应用、Google 搜索和 Ads 等 Google 产品中逐步推出。该模型定位于支持更高质量输出,并具备保持主体一致性和更严格遵循复杂指令的功能。
主要特性
- Gemini 真实世界知识驱动的先进世界知识:模型利用 Gemini 知识库,并通过网络搜索的实时信息和图像,更准确地渲染特定主体。
- 增强创意控制以实现主体一致性:模型支持单次工作流中最多五个人物的相似度以及最多 14 个物体的保真度,帮助在构建序列或叙事时跨编辑保持外观一致。
- 图像内精确文本渲染和翻译:Nano Banana 2 可为营销样稿或贺卡等资产生成准确、可读文本,并能在图像内本地化/翻译文本。
- 改进的指令遵循:Google 表示,该模型更严格遵守复杂请求,包括想法的细微细节,更好匹配用户需求。
- 多尺寸生产就绪图像规格:用户可控制512px 至 4K的宽高比和分辨率,支持竖屏社交帖或宽屏背景等格式输出。
- Flash 速度下的视觉保真度提升:Google 描述其具有更丰富的纹理、更锐利的细节和更生动的光照,同时保持 Flash 预期速度。
如何使用 Nano Banana 2
首先,通过已支持的 Google 产品(Google 指出正在 Gemini、搜索和 Ads 中推出)访问 Nano Banana 2。输入描述主体、风格和所需变更的提示。当需要在序列中保持角色或物体一致时,在提示中包含这些元素并指定场景演变方式。
对于营销或沟通资材,使用需要可读文本或本地化/翻译文本的提示,并请求特定宽高比或分辨率(视可用性而定),以匹配预期位置。
使用场景
- 从笔记创建信息图和图表:使用提示将主题转化为结构化视觉(如生成水循环信息图),利用模型的世界知识渲染特定主体。
- 生成带可读图像文本的营销样稿:请求用于标牌或促销图形的准确文本,然后生成不同宽高比的版本以适应不同位置。
- 为全球受众本地化图像内容:要求模型翻译并本地化图像内文本,以便视觉内容跨语言复用。
- 带一致角色的故事板式工作流:对于多帧叙事,指定最多五个人物相似度和最多 14 个物体,以跨编辑保持角色和关键物品一致。
- 带受控格式规格的广告或活动资材:通过选择 512px 至 4K 的宽高比和分辨率,快速迭代基于提示优化的常见创意尺寸视觉。
常见问题
-
在哪里可以访问 Nano Banana 2? Google 表示,它正在包括 Gemini 应用、Google 搜索 和 Ads 在内的 Google 产品中逐步推出。
-
此处“Flash 速度”是什么意思? 该页面描述 Nano Banana 2 结合 Nano Banana Pro 能力与 Gemini Flash 的速度,实现更快图像生成及更迅捷编辑和迭代。
-
它能跨编辑保持角色或物体一致吗? 可以。Google 表示支持单次工作流中最多五个人物相似度和最多 14 个物体保真度。
-
它能生成图像内可读文本并翻译吗? Google 表示,它能为营销样稿或贺卡生成精确文本渲染,并能翻译/本地化图像内文本。
-
它支持什么输出尺寸? 该模型支持从 512px 至 4K 的各种宽高比和分辨率。
替代方案
- 其他 AI 图像生成模型:AI 图像生成类别的许多工具都能从提示词生成图像,但可能在一致遵循指令、保持主体保真度或渲染文本方面有所差异。
- 使用生成 + 修复/扩展的图像编辑工作流:对于注重迭代优化的用户,以编辑为先的方法(先生成,然后选择性修改部分)可作为替代方案,尽管可能需要更多手动步骤来保持角色/物体一致性。
- 支持人工编辑文本的模板设计工具:如果可读文本和本地化是主要需求,基于模板的工作流可减少对模型文本渲染的依赖,通过保持排版可编辑——代价是视觉整合不如无缝。
- 通用创意套件:对于优先考虑布局、排版和资产管理的生产管道,创意套件可在图像生成后补充处理最终设计和格式化。
替代品
PXZ AI
一个集成图像、视频、语音、写作和聊天工具的全能AI平台,以增强创造力和协作。
Pic Copilot
使用AI时尚模特、AI产品图像和UGC视频,全面提升您的电子商务商店。无需专业摄影或设计技能。
exactly.ai
exactly.ai 是面向团队的 AI 形象生成与创意工作室,可用签名图像复制品牌视觉风格,生成保持在品牌内的多样作品,且流程更私密。
GPTIMG2 AI
GPTIMG2 AI(GPT Image 2)图像优先AI生成器,支持基于提示词的精修,帮助保留主体、布局与可读的画面文字,用于海报与产品图。
TapNow
TapNow 是面向企业与创作者的 AI 原生视觉创作引擎,生成电商广告到电影短片与实验艺术的专业级视觉。
Hotpot.ai
Hotpot.ai 是 AI 图像生成与AI证件照平台,可用人像编辑工具进行照片美化(如放大、去背景),并提供AI写作与图形模板。