Nano Banana de Google

Google Nano Banana (Gemini 2.5 Flash Image): la próxima evolución de la edición de imágenes con IA

La edición de imágenes con IA acaba de subir de nivel.

Conoce Nano Banana—El nuevo y poderoso modelo de imagen de Google dentro de Gemini 2.5 Flash Image. Con el lenguaje natural, puedes edita fotos paso a paso, mantén la coherencia de los personajes, mezcla varias imágenes y reimagina cualquier cosa con el conocimiento del mundo.

En este vídeo, hacemos una demostración de Nano Banana capacidades alucinantes:
✨ Edición en varios pasos
🧑 ‍ 🚀 Coherencia de personajes (la misma cara en todas las ediciones)
🌍 Mezcla de imágenes y conocimiento mundial
🛡️ Marca de agua integrada + SyntHid

Ya disponible en la aplicación Gemini (web y móvil) y para desarrolladores a través de Gemini API, AI Studio y Vertex AI.

Google Nano Banana (imagen flash de Gemini 2.5): desglose completo de capacidades

Google ha presentado oficialmente Nano Banana, el divertido nombre en clave de su nuevo modelo de imagen de IA Imagen Flash de Gemini 2.5. Este modelo está diseñado para ampliar los límites de lo que puede hacer la edición y generación de imágenes mediante IA, combinando velocidad, fidelidad y conocimiento mundial. Este es un desglose completo de sus capacidades, extraído de la documentación de Google, las notas de los desarrolladores y los comentarios reales de los usuarios de Reddit y otros sitios.

1. Generación de imágenes

De texto a imagen: Genere imágenes de alta calidad a partir de indicaciones en lenguaje natural.
Diseñado para incitación conversacional, lo que lo hace más natural que los sistemas con muchas palabras clave.
Casos de uso: arte conceptual, contenido social, imágenes de marketing creativas.

2. Edición de imágenes

Ediciones locales y globales: Elimina o añade objetos, difumina fondos, cambia posturas, colorea imágenes en blanco y negro.
Edición en varios turnos: Refina de forma iterativa la misma imagen a través de una conversación. Ejemplo: «Haz que se ponga el sol → Añade linternas → Pon fuegos artificiales de fondo».
Recoloración y restauración: Repara imágenes antiguas o cambia los colores de forma creativa y precisa.

3. Coherencia de carácter y estilo

Preservación de identidad: Mantiene la coherencia de rostros, mascotas o personajes en múltiples ediciones y contextos.
Adherencia a la plantilla: Funciona bien con diseños estructurados como tarjetas de productos, catálogos e insignias de identificación.
Intercambios de atuendo y época: Cambia la ropa o el período de tiempo de un personaje mientras mantienes la misma identidad.

4. Fusión y composición de múltiples imágenes

Mezcla de imágenes: Combina dos o más imágenes en una escena compuesta coherente.
Transferencia de estilo: Aplica el estilo de una imagen (por ejemplo, alas de mariposa) a un objeto de otra (por ejemplo, un vestido).
Collages creativos: Combine sin problemas entradas dispares en nuevos conceptos.

5. Edición basada en el conocimiento mundial

Impulsado por la comprensión semántica de Gemini, el modelo «conoce» el contexto.
Ejemplo: «Mona Lisa como DJ cyberpunk en Tokio» produce una escena que tiene sentido tanto artística como temáticamente.
Capaz de manejar lectura de diagramas y ediciones basadas en el contexto.

6. Funciones de IA responsable

Marca de agua: Cada imagen incluye una marca de agua visible (en la aplicación Gemini) e invisible SynthID para la trazabilidad.
Barandas de seguridad: Reduce las ediciones dañinas o engañosas.

7. Integración de desarrolladores

Disponible a través de:
- Aplicación Gemini (web y móvil)
- Estudio de API e IA Gemini
- Vertex AI para flujos de trabajo empresariales
Socios: Integraciones con Adobe Firefly, Figma, WPP, Quora Poe, Freepik y más.
Especificaciones del modelo: ID del modelo vista previa de imagen flash de gemini-2.5; la entrada/salida incluye texto e imagen; admite hasta 32 000 tokens.
Precios: ~30 $ por cada 1 millón de fichas de salida (～ 0,039$ por imagen).

8. Comentarios destacados de los usuarios

Edición de Fidelity: Los usuarios de Reddit dicen que está «en una liga diferente» en comparación con competidores como Qwen Image, Flux Kontext o GPT-Image.
Estabilidad de identidad: Elogios por lo bien que mantiene la misma imagen en todas las ediciones.
Adherencia inmediata: Alta precisión tanto para las tareas de generación como de edición.
Notas de lanzamiento: Algunas restricciones regionales y limitaciones de cuenta iniciales, pero ahora están disponibles para todo el mundo.

9. ¿Qué sigue?

Google reconoce las áreas en las que aún está mejorando:
- Representación de texto en imágenes (pasajes largos)
- Detalles fácticos precisos (objetos pequeños, fidelidad del texto)
- Una coherencia de identidad aún mayor

Conclusión

Imagen flash de Nano Banana/Gemini 2.5 representa un salto adelante en la edición de imágenes con IA. No se trata solo de generar imágenes bonitas, sino de crear imágenes coherentes, editables y adaptadas al contexto. Al estar disponible tanto en los canales de consumidores (aplicación Gemini) como en los de desarrolladores (API, Vertex AI), este modelo está destinado a redefinir la creatividad asistida por la IA.

Para los creadores, diseñadores y desarrolladores, Nano Banana es más que un modelo de IA más: es un nuevo estándar para edición de imágenes flexible, responsable y de alta fidelidad.

Escrito por:

Kam

Kam es estudiante de máster en Dubái y estudia Inteligencia Artificial. ¡Se unió al equipo de Promptus para ayudar a llevar la creación de contenido a todos!

Pruebe Promptus Cosy UI hoy gratis.