Google Meluncurkan Nano Banana 2 Lite dan Gemini Omni Flash API
Google telah memperluas ekosistem AI generatifnya dengan merilis dua model baru yang kuat, yang dirancang untuk memangkas latensi dan membuka kreativitas sinematik. Dengan memperkenalkan Nano Banana 2 Lite untuk pembuatan gambar berkecepatan tinggi dan Gemini Omni Flash untuk sintesis video, Google menyediakan alur kerja (pipeline) yang efisien bagi para pengembang untuk beralih dari konsep statis ke media bergerak.
Nano Banana 2 Lite: Pembuatan Gambar Ber-throughput Tinggi
Google menargetkan permintaan pengembang akan kecepatan dan efisiensi biaya dengan meluncurkan Nano Banana 2 Lite (secara teknis diidentifikasi dalam API sebagai gemini-3.1-flash-lite-image). Model ini dibuat khusus untuk ideasi cepat dan alur kerja produksi bervolume tinggi, yang mampu menghasilkan gambar resolusi 1K hanya dalam empat detik.
Dengan harga $0,034 per gambar, Nano Banana 2 Lite menawarkan keuntungan ekonomi yang signifikan bagi perusahaan yang menjalankan alur kerja pembuatan gambar secara masif. Meskipun kecepatannya dioptimalkan, Google mengklaim model ini tetap mempertahankan standar tinggi dalam mengikuti perintah (prompt), konsistensi karakter, dan keterbacaan teks. Model ini melengkapi hierarki tiga tingkat:
- Nano Banana 2 Lite: Berfokus pada kecepatan ekstrem dan biaya rendah.
- Nano Banana 2 (Gemini 3.1 Flash Image): Sang "all-rounder" yang serbaguna.
- Nano Banana Pro (Gemini 3.1 Pro Image): Dirancang untuk penalaran tingkat profesional dan kontrol yang kompleks.
Model ini tidak hanya untuk pengembang; model ini sedang diintegrasikan ke seluruh ekosistem Google, termasuk Google Search (AI Mode), NotebookLM, Google Photos, dan Google Ads.
Gemini Omni Flash: Menghadirkan Video ke API
Menyusul pratinjunya di Google I/O, Gemini Omni Flash kini tersedia secara resmi melalui Gemini API dan Google AI Studio. Model ini mewakili lompatan dalam penalaran multimodal, yang memungkinkan pengembang untuk menghasilkan dan mengedit video menggunakan perintah bahasa alami. Dengan harga $0,10 per detik output video, model ini bersaing ketat dengan Veo 3.1 Fast.
Gemini Omni Flash unggul dalam "pengeditan video percakapan" (conversational video editing), di mana pengguna dapat menyempurnakan klip menggunakan teks, gambar, atau video yang sudah ada sebagai input. Meskipun keterbatasan saat ini mencakup durasi klip maksimum 10 detik dan konsistensi karakter yang terbatas pada gerakan kamera yang kompleks, kemampuan model ini untuk menyinkronkan teks dan grafis dengan aksi video menandai langkah maju yang signifikan bagi pembuatan konten berbasis AI.
Kekuatan Model Chaining dan Interactions API
Nilai strategis sejati dari rilis ini terletak pada sinergi antara kedua model tersebut. Google mendorong alur kerja "chaining": pengembang dapat menggunakan Nano Banana 2 Lite untuk menghasilkan gambar referensi berkualitas tinggi secara instan, lalu memasukkan gambar tersebut ke dalam Gemini Omni Flash untuk menganimasikannya menjadi video.
Untuk memfasilitasi hal ini, Google mempromosikan Interactions API miliknya, yang berfungsi sebagai standar untuk alur kerja ini. API tersebut menjaga riwayat sesi dan konteks, memungkinkan hingga tiga pengeditan berturut-turut, sehingga proses kreatif terasa lebih seperti dialog berkelanjutan dengan AI. Untuk mendemonstrasikan kemampuan ini, Google telah meluncurkan tiga aplikasi demo: "Anywhere" untuk animasi perjalanan, "Space Lift" untuk desain interior, dan "Omni Product Studio" untuk pembuatan video e-commerce.
Seperti semua model generatif Google, baik Nano Banana 2 Lite maupun Gemini Omni Flash menggunakan watermark SynthID untuk memastikan konten buatan AI dapat diverifikasi di seluruh platform Google.
Poin-Poin Penting
- Efisiensi dalam Skala Besar: Nano Banana 2 Lite menghasilkan gambar 1K dalam empat detik hanya dengan $0,034, mengoptimalkan alur kerja untuk kebutuhan throughput tinggi.
- Pengeditan Video Multimodal: Gemini Omni Flash memperkenalkan pembuatan dan pengeditan video dengan bahasa alami ke Gemini API seharga $0,10 per detik.
- Alur Kerja Kreatif Terintegrasi: Pengembang dapat menghubungkan (chain) model gambar dan video melalui Interactions API untuk mengubah aset statis menjadi konten animasi secara mulus.
