Google lancia Nano Banana 2 Lite e l'API Gemini Omni Flash

Google ha ampliato il suo ecosistema di IA generativa con il rilascio di due nuovi e potenti modelli progettati per ridurre drasticamente la latenza e sbloccare la creatività cinematografica. Introducendo Nano Banana 2 Lite per la generazione di immagini ad alta velocità e Gemini Omni Flash per la sintesi video, Google mette a disposizione degli sviluppatori una pipeline ottimizzata per passare da concetti statici a contenuti multimediali in movimento.

Nano Banana 2 Lite: Generazione di immagini ad alto rendimento

Google punta a soddisfare la richiesta di velocità ed efficienza economica degli sviluppatori con il lancio di Nano Banana 2 Lite (tecnicamente identificato nell'API come gemini-3.1-flash-lite-image). Questo modello è progettato specificamente per l'ideazione rapida e per pipeline di produzione ad alto volume, essendo in grado di generare immagini a risoluzione 1K in soli quattro secondi.

Con un prezzo di 0,034 $ per immagine, Nano Banana 2 Lite offre un significativo vantaggio economico per le aziende che gestiscono flussi di lavoro massivi di generazione di immagini. Nonostante la velocità ottimizzata, Google afferma che il modello mantiene elevati standard per il rispetto dei prompt, la coerenza dei personaggi e la leggibilità del testo. Questo modello completa una gerarchia a tre livelli:

  • Nano Banana 2 Lite: Focalizzato su velocità estrema e bassi costi.
  • Nano Banana 2 (Gemini 3.1 Flash Image): Il versatile "tuttofare".
  • Nano Banana Pro (Gemini 3.1 Pro Image): Progettato per il ragionamento di livello professionale e il controllo complesso.

Il modello non è destinato solo agli sviluppatori; viene integrato in tutto l'ecosistema Google, inclusi Google Search (AI Mode), NotebookLM, Google Photos e Google Ads.

Gemini Omni Flash: Il video arriva nelle API

Dopo l'anteprima a Google I/O, Gemini Omni Flash è ora ufficialmente disponibile tramite la Gemini API e Google AI Studio. Questo modello rappresenta un salto di qualità nel ragionamento multimodale, consentendo agli sviluppatori di generare e modificare video utilizzando prompt in linguaggio naturale. Con un prezzo di 0,10 $ per secondo di video prodotto, si posiziona in modo competitivo accanto a Veo 3.1 Fast.

Gemini Omni Flash eccelle nel "video editing conversazionale", in cui gli utenti possono perfezionare le clip utilizzando testo, immagini o video esistenti come input. Sebbene le attuali limitazioni includano una durata massima della clip di 10 secondi e una coerenza limitata dei personaggi durante movimenti di camera complessi, la capacità del modello di sincronizzare testo e grafica con le azioni video segna un passo avanti significativo per la creazione di contenuti guidata dall'IA.

La potenza del Model Chaining e dell'Interactions API

Il vero valore strategico di questo rilascio risiede nella sinergia tra i due modelli. Google sta incoraggiando un flusso di lavoro basato sul "chaining" (concatenazione): gli sviluppatori possono utilizzare Nano Banana 2 Lite per generare istantaneamente un'immagine di riferimento di alta qualità e poi fornire tale immagine a Gemini Omni Flash per animarla in un video.

Per facilitare questo processo, Google sta promuovendo la sua Interactions API, che funge da standard per questi flussi di lavoro. L'API preserva la cronologia e il contesto della sessione, consentendo fino a tre modifiche consecutive, rendendo il processo creativo simile a un dialogo continuo con l'IA. Per dimostrare queste capacità, Google ha lanciato tre app demo: "Anywhere" per l'animazione di viaggi, "Space Lift" per l'interior design e "Omni Product Studio" per la generazione di video per l'e-commerce.

Come per tutti i modelli generativi di Google, sia Nano Banana 2 Lite che Gemini Omni Flash utilizzano il watermarking SynthID per garantire che i contenuti generati dall'IA possano essere verificati su tutte le piattaforme Google.

Punti chiave

  • Efficienza su scala: Nano Banana 2 Lite fornisce immagini 1K in quattro secondi a soli 0,034 $, ottimizzando i flussi di lavoro per esigenze di alto rendimento.
  • Video editing multimodale: Gemini Omni Flash introduce la generazione e l'editing video tramite linguaggio naturale nella Gemini API a 0,10 $ al secondo.
  • Pipeline creativa integrata: Gli sviluppatori possono concatenare modelli di immagine e video tramite l'Interactions API per trasformare asset statici in contenuti animati in modo fluido.