UStackUStack
Nano Banana 2 icon

Nano Banana 2

Nano Banana 2 (Gemini 3.1 Flash Image) es el modelo de generación de imágenes de Google DeepMind con velocidad Flash para editar e iterar más rápido.

Nano Banana 2

¿Qué es Nano Banana 2?

Nano Banana 2 es el modelo de generación de imágenes más reciente de Google DeepMind, lanzado como “Gemini 3.1 Flash Image”. Está diseñado para combinar capacidades avanzadas asociadas con Nano Banana Pro con la velocidad de Gemini Flash para una generación de imágenes más rápida y ediciones e iteraciones más veloces.

Según Google, Nano Banana 2 se está implementando en productos de Google como la app Gemini, Google Search y Ads. El modelo está posicionado para ofrecer salidas de mayor calidad, además de funciones para mantener la fidelidad del sujeto y seguir instrucciones complejas con mayor precisión.

Características principales

  • Conocimiento avanzado del mundo impulsado por el conocimiento real de Gemini: El modelo utiliza la base de conocimiento de Gemini y se alimenta de información e imágenes en tiempo real de búsquedas web para representar sujetos específicos con mayor precisión.
  • Mayor control creativo para consistencia de sujetos: El modelo soporta similitud de personajes de hasta cinco personajes y fidelidad de hasta 14 objetos en un solo flujo de trabajo, ayudando a mantener la apariencia en ediciones al construir secuencias o narrativas.
  • Renderizado preciso de texto y traducción dentro de imágenes: Nano Banana 2 puede generar texto preciso y legible para activos como maquetas de marketing o tarjetas de salutación, y también localizar/traducir texto dentro de una imagen.
  • Mejor seguimiento de instrucciones: Google informa que el modelo se adhiere más estrictamente a solicitudes complejas, incluyendo detalles matizados de una idea, para coincidir mejor con lo que pidió el usuario.
  • Especificaciones de imagen listas para producción en múltiples tamaños: Los usuarios pueden controlar relaciones de aspecto y resoluciones desde 512px hasta 4K, soportando salidas para formatos como publicaciones verticales en redes sociales y fondos panorámicos.
  • Mejoras en fidelidad visual a velocidad Flash: Google describe texturas más ricas, detalles más nítidos y iluminación vibrante, manteniendo la velocidad esperada de Flash.

Cómo usar Nano Banana 2

Para empezar, accede a Nano Banana 2 a través de los productos de Google donde está disponible (Google indica su implementación en Gemini, Search y Ads). Ingresa prompts que describan el sujeto, estilo y cambios deseados. Cuando necesites personajes u objetos consistentes en una secuencia, incluye esos elementos en el prompt y especifica cómo debe evolucionar la escena.

Para activos de marketing o comunicación, usa prompts que requieran texto legible o texto localizado/traducido, y solicita relaciones de aspecto o resoluciones específicas (donde estén disponibles) para adaptarse a tu colocación prevista.

Casos de uso

  • Crear infografías y diagramas a partir de notas: Usa prompts para convertir temas en visuales estructurados (por ejemplo, generar una infografía como el ciclo del agua), aprovechando el conocimiento del mundo descrito del modelo para representar sujetos específicos.
  • Generar maquetas de marketing con texto legible en la imagen: Solicita texto preciso para materiales como carteles o gráficos promocionales, luego genera versiones en diferentes relaciones de aspecto para distintas colocaciones.
  • Localizar contenido de imagen para audiencias globales: Pide al modelo que traduzca y localice texto dentro de una imagen para reutilizar el visual en diferentes idiomas.
  • Flujos de trabajo tipo storyboard con personajes consistentes: Para narrativas con múltiples fotogramas, especifica hasta cinco similitudes de personajes y hasta 14 objetos para mantener personajes y elementos clave consistentes en ediciones.
  • Activos para anuncios o campañas con especificaciones de formato controladas: Produce visuales dimensionados para necesidades creativas comunes seleccionando relaciones de aspecto y resoluciones desde 512px hasta 4K, e iterando rápidamente con refinamientos de prompts.

Preguntas frecuentes

  • ¿Dónde puedo acceder a Nano Banana 2? Google indica que se está implementando en productos de Google como la app Gemini, Google Search y Ads.

  • ¿Qué significa “velocidad Flash” en este contexto? La página describe Nano Banana 2 como una combinación de capacidades de Nano Banana Pro con la velocidad de Gemini Flash, permitiendo generación de imágenes más rápida y ediciones e iteraciones más veloces.

  • ¿Puede mantener personajes u objetos consistentes en ediciones? Sí. Google informa soporte para mantener similitud de personajes hasta cinco personajes y fidelidad de hasta 14 objetos en un solo flujo de trabajo.

  • ¿Puede generar texto legible en la imagen y traducirlo? Google dice que puede producir renderizado preciso de texto para maquetas de marketing o tarjetas de salutación y traducir/localizar texto dentro de una imagen.

  • ¿Qué tamaños de salida soporta? El modelo soporta diversas relaciones de aspecto y resoluciones desde 512px hasta 4K.

Alternativas

  • Otros modelos de generación de imágenes con IA: Muchos modelos en la categoría de generación de imágenes con IA pueden producir imágenes a partir de indicaciones, pero pueden diferir en la consistencia al seguir instrucciones, mantener la fidelidad del sujeto o renderizar texto.
  • Flujos de trabajo de edición de imágenes con generación + inpainting/outpainting: Para usuarios enfocados en refinamiento iterativo, un enfoque de edición primero (generar, luego revisar partes selectivamente) puede ser una alternativa, aunque puede requerir más pasos manuales para preservar la consistencia de personajes/objetos.
  • Herramientas de diseño basadas en plantillas con texto editable por humanos: Si el texto legible y la localización son los requisitos principales, los flujos de trabajo basados en plantillas pueden reducir la dependencia del renderizado de texto del modelo manteniendo la tipografía editable—a costa de una integración visual menos fluida.
  • Suites creativas de propósito general: Para tuberías de producción que priorizan el diseño, tipografía y gestión de activos, las suites creativas pueden complementar la generación con IA manejando el diseño y formateo final una vez generada la imagen.
Nano Banana 2 | UStack