UStackUStack
Nano Banana 2 icon

Nano Banana 2

Nano Banana 2 (Gemini 3.1 Flash Image) d’Google DeepMind : génération d’images plus rapide et retouches plus fluides dans Gemini, Search et Ads.

Nano Banana 2

Qu’est-ce que Nano Banana 2 ?

Nano Banana 2 est le dernier modèle de génération d’images de Google DeepMind, sorti sous le nom de « Gemini 3.1 Flash Image ». Il est conçu pour combiner les capacités avancées associées à Nano Banana Pro avec la vitesse de Gemini Flash pour une génération d’images plus rapide et des retouches et itérations accélérées.

Selon Google, Nano Banana 2 est déployé sur divers produits Google tels que l’app Gemini, Google Search et Ads. Le modèle vise des sorties de meilleure qualité avec des fonctionnalités pour préserver la fidélité des sujets et suivre plus fidèlement les instructions complexes.

Fonctionnalités clés

  • Connaissances mondiales avancées alimentées par les connaissances réelles de Gemini : Le modèle exploite la base de connaissances de Gemini et s’appuie sur des informations et images en temps réel issues de la recherche web pour restituer les sujets avec plus de précision.
  • Contrôle créatif renforcé pour la cohérence des sujets : Le modèle gère la ressemblance de jusqu’à cinq personnages et la fidélité de jusqu’à 14 objets dans un seul flux de travail, aidant à conserver l’apparence lors des retouches pour créer des séquences ou récits.
  • Rendu de texte précis et traduction à l’intérieur des images : Nano Banana 2 génère du texte précis et lisible pour des assets comme des maquettes marketing ou cartes de vœux, et peut aussi localiser/traduire le texte dans une image.
  • Suivi d’instructions amélioré : Google indique que le modèle respecte plus strictement les demandes complexes, y compris les détails nuancés d’une idée, pour mieux correspondre à la requête de l’utilisateur.
  • Spécifications d’images prêtes pour la production dans plusieurs tailles : Les utilisateurs contrôlent les ratios d’aspect et résolutions de 512px à 4K, pour des sorties adaptées aux posts sociaux verticaux ou arrière-plans grand écran.
  • Fidélité visuelle améliorée à la vitesse Flash : Google décrit des textures plus riches, détails plus nets et éclairage vibrant, tout en conservant la vitesse attendue de Flash.

Comment utiliser Nano Banana 2

Pour commencer, accédez à Nano Banana 2 via les produits Google où il est disponible (Google mentionne un déploiement sur Gemini, Search et Ads). Saisissez des prompts décrivant le sujet, le style et les modifications souhaitées. Pour des personnages ou objets cohérents dans une séquence, incluez-les dans le prompt et précisez l’évolution de la scène.

Pour des assets marketing ou communication, utilisez des prompts nécessitant du texte lisible ou localisé/traduit, et demandez des ratios d’aspect ou résolutions spécifiques (si disponibles) pour correspondre à l’emplacement prévu.

Cas d’usage

  • Créer des infographies et diagrammes à partir de notes : Utilisez des prompts pour transformer des sujets en visuels structurés (par exemple, générer une infographie comme le cycle de l’eau), en exploitant les connaissances mondiales du modèle pour restituer les sujets spécifiques.
  • Générer des maquettes marketing avec texte lisible sur image : Demandez du texte précis pour des supports comme de la signalétique ou graphismes promotionnels, puis générez des versions en différents ratios d’aspect pour divers emplacements.
  • Localiser le contenu d’images pour un public mondial : Demandez au modèle de traduire et localiser le texte dans une image pour réutiliser le visuel dans plusieurs langues.
  • Flux de travail type storyboard avec personnages cohérents : Pour des récits à plusieurs frames, spécifiez jusqu’à cinq ressemblances de personnages et jusqu’à 14 objets pour garder personnages et éléments clés constants lors des retouches.
  • Assets publicitaires ou campagnes avec specs de format contrôlées : Produisez des visuels adaptés aux besoins créatifs courants en sélectionnant ratios d’aspect et résolutions de 512px à 4K, et itérez rapidement via affinements de prompts.

FAQ

  • Où puis-je accéder à Nano Banana 2 ? Google indique un déploiement sur divers produits Google incluant l’app Gemini, Google Search et Ads.

  • Que signifie « vitesse Flash » dans ce contexte ? La page décrit Nano Banana 2 comme combinant les capacités de Nano Banana Pro avec la vitesse de Gemini Flash, pour une génération d’images plus rapide et des retouches et itérations accélérées.

  • Peut-il conserver la cohérence des personnages ou objets lors des retouches ? Oui. Google rapporte un support pour maintenir la ressemblance de jusqu’à cinq personnages et la fidélité de jusqu’à 14 objets dans un seul flux de travail.

  • Peut-il générer du texte lisible dans l’image et le traduire ? Google affirme qu’il produit un rendu de texte précis pour maquettes marketing ou cartes de vœux et peut traduire/localiser le texte dans une image.

  • Quelles tailles de sortie supporte-t-il ? Le modèle supporte divers ratios d’aspect et résolutions de 512px à 4K.

Alternatives

  • Autres modèles de génération d’images IA : De nombreux outils de la catégorie génération d’images IA peuvent produire des images à partir de prompts, mais diffèrent souvent en termes de fidélité aux instructions, de cohérence des sujets ou de rendu du texte.
  • Flux de travail d’édition d’images par génération + inpainting/outpainting : Pour les utilisateurs axés sur le raffinement itératif, une approche centrée sur l’édition (génération puis révision sélective de parties) peut être une alternative, bien qu’elle nécessite plus d’étapes manuelles pour préserver la cohérence des personnages/objets.
  • Outils de conception basés sur des templates avec texte modifiable manuellement : Si un texte lisible et la localisation sont les exigences principales, les flux de travail basés sur templates réduisent la dépendance au rendu de texte du modèle en gardant la typographie éditable—au prix d’une intégration visuelle moins fluide.
  • Suites créatives polyvalentes : Pour les pipelines de production priorisant la mise en page, la typographie et la gestion d’actifs, les suites créatives complètent la génération IA en gérant la conception et le formatage final une fois l’imagerie générée.