Google lanza Nano Banana 2 Lite y la API Gemini Omni Flash

Google ha ampliado su ecosistema de IA generativa con el lanzamiento de dos nuevos y potentes modelos diseñados para reducir drásticamente la latencia y desbloquear la creatividad cinematográfica. Al introducir Nano Banana 2 Lite para la generación de imágenes de alta velocidad y Gemini Omni Flash para la síntesis de video, Google ofrece a los desarrolladores un flujo de trabajo optimizado para pasar de conceptos estáticos a medios en movimiento.

Nano Banana 2 Lite: Generación de imágenes de alto rendimiento

Google busca satisfacer la demanda de los desarrolladores de velocidad y rentabilidad con el lanzamiento de Nano Banana 2 Lite (identificado técnicamente en la API como gemini-3.1-flash-lite-image). Este modelo está diseñado específicamente para la ideación rápida y los flujos de producción de gran volumen, siendo capaz de generar imágenes de resolución 1K en solo cuatro segundos.

Con un precio de 0,034 $ por imagen, Nano Banana 2 Lite ofrece una ventaja económica significativa para las empresas que ejecutan flujos de trabajo masivos de generación de imágenes. A pesar de su velocidad optimizada, Google afirma que el modelo mantiene altos estándares de seguimiento de instrucciones, consistencia de personajes y legibilidad de texto. Este modelo completa una jerarquía de tres niveles:

  • Nano Banana 2 Lite: Enfocado en la velocidad extrema y el bajo costo.
  • Nano Banana 2 (Gemini 3.1 Flash Image): El versátil "todoterreno".
  • Nano Banana Pro (Gemini 3.1 Pro Image): Diseñado para el razonamiento de nivel profesional y el control complejo.

El modelo no es solo para desarrolladores; se está integrando en todo el ecosistema de Google, incluyendo Google Search (AI Mode), NotebookLM, Google Photos y Google Ads.

Gemini Omni Flash: Llevando el video a la API

Tras su avance en Google I/O, Gemini Omni Flash ya está disponible oficialmente a través de la Gemini API y Google AI Studio. Este modelo representa un salto en el razonamiento multimodal, permitiendo a los desarrolladores generar y editar video mediante instrucciones en lenguaje natural. Con un precio de 0,10 $ por segundo de video generado, se posiciona de forma competitiva junto a Veo 3.1 Fast.

Gemini Omni Flash destaca en la "edición de video conversacional", donde los usuarios pueden perfeccionar clips utilizando texto, imágenes o video existente como entrada. Aunque las limitaciones actuales incluyen una duración máxima de clip de 10 segundos y una consistencia de personajes limitada en movimientos de cámara complejos, la capacidad del modelo para sincronizar texto y gráficos con las acciones del video marca un paso significativo hacia la creación de contenido impulsada por IA.

El poder del encadenamiento de modelos y la Interactions API

El verdadero valor estratégico de este lanzamiento reside en la sinergia entre los dos modelos. Google está fomentando un flujo de trabajo de "encadenamiento" (chaining): los desarrolladores pueden usar Nano Banana 2 Lite para generar instantáneamente una imagen de referencia de alta calidad y luego introducir esa imagen en Gemini Omni Flash para animarla en un video.

Para facilitar esto, Google está promocionando su Interactions API, que sirve como estándar para estos flujos de trabajo. La API preserva el historial y el contexto de la sesión, permitiendo hasta tres ediciones consecutivas, lo que hace que el proceso creativo se sienta más como un diálogo continuo con la IA. Para demostrar estas capacidades, Google ha lanzado tres aplicaciones de demostración: "Anywhere" para animación de viajes, "Space Lift" para diseño de interiores y "Omni Product Studio" para la generación de videos de comercio electrónico.

Al igual que todos los modelos generativos de Google, tanto Nano Banana 2 Lite como Gemini Omni Flash utilizan el marcado de agua SynthID para garantizar que el contenido generado por IA pueda ser verificado en todas las plataformas de Google.

Conclusiones clave

  • Eficiencia a escala: Nano Banana 2 Lite entrega imágenes 1K en cuatro segundos por solo 0,034 $, optimizando los flujos de trabajo para necesidades de alto rendimiento.
  • Edición de video multimodal: Gemini Omni Flash introduce la generación y edición de video mediante lenguaje natural en la Gemini API a 0,10 $ por segundo.
  • Flujo creativo integrado: Los desarrolladores pueden encadenar modelos de imagen y video a través de la Interactions API para transformar activos estáticos en contenido animado sin interrupciones.