Google Melancarkan Nano Banana 2 Lite dan API Gemini Omni Flash

Google telah memperluas ekosistem AI generatifnya dengan pelancaran dua model baharu yang berkuasa, direka untuk mengurangkan kependaman dan membuka kreativiti sinematik. Dengan memperkenalkan Nano Banana 2 Lite untuk penjanaan imej berkelajuan tinggi dan Gemini Omni Flash untuk sintesis video, Google menyediakan saluran (pipeline) yang lancar bagi pembangun untuk beralih daripada konsep statik kepada media bergerak.

Nano Banana 2 Lite: Penjanaan Imej Berkapasiti Tinggi

Google menyasarkan permintaan pembangun terhadap kelajuan dan kecekapan kos dengan pelancaran Nano Banana 2 Lite (secara teknikal dikenal pasti dalam API sebagai gemini-3.1-flash-lite-image). Model ini dibina khusus untuk penjanaan idea pantas dan saluran pengeluaran volum tinggi, yang mampu menjana imej resolusi 1K dalam masa hanya empat saat.

Pada harga $0.034 setiap imej, Nano Banana 2 Lite menawarkan kelebihan ekonomi yang ketara bagi syarikat yang menjalankan aliran kerja penjanaan imej secara besar-besaran. Walaupun kelajuannya telah dioptimumkan, Google mendakwa model ini mengekalkan piawaian tinggi untuk pematuhan arahan, konsistensi watak, dan kebolehbacaan teks. Model ini melengkapkan hierarki tiga peringkat:

  • Nano Banana 2 Lite: Fokus pada kelajuan ekstrem dan kos rendah.
  • Nano Banana 2 (Gemini 3.1 Flash Image): "Serba boleh" yang versatil.
  • Nano Banana Pro (Gemini 3.1 Pro Image): Direka untuk penaakulan gred profesional dan kawalan kompleks.

Model ini bukan sahaja untuk pembangun; ia sedang disepadukan ke seluruh ekosistem Google, termasuk Google Search (AI Mode), NotebookLM, Google Photos, dan Google Ads.

Gemini Omni Flash: Membawa Video ke API

Susulan pratontonnya di Google I/O, Gemini Omni Flash kini tersedia secara rasmi melalui Gemini API dan Google AI Studio. Model ini mewakili lonjakan dalam penaakulan multimodal, membolehkan pembangun menjana dan menyunting video menggunakan arahan bahasa tabii. Berharga $0.10 bagi setiap saat output video, ia bersaing secara kompetitif dengan Veo 3.1 Fast.

Gemini Omni Flash cemerlang dalam "penyuntingan video perbualan," di mana pengguna boleh memperhalusi klip menggunakan teks, imej, atau video sedia ada sebagai input. Walaupun had semasa termasuk panjang klip maksimum 10 saat dan konsistensi watak yang terhad merentasi pergerakan kamera yang kompleks, keupayaan model ini untuk menyelaraskan teks dan grafik dengan aksi video menandakan langkah besar ke hadapan bagi penciptaan kandungan dipacu AI.

Kuasa Rantaian Model dan API Interactions

Nilai strategik sebenar pelancaran ini terletak pada sinergi antara kedua-dua model tersebut. Google menggalakkan aliran kerja "perantaian" (chaining): pembangun boleh menggunakan Nano Banana 2 Lite untuk menjana imej rujukan berkualiti tinggi secara serta-merta dan kemudian memasukkan imej tersebut ke dalam Gemini Omni Flash untuk menganimasikannya menjadi video.

Bagi memudahkan perkara ini, Google mempromosikan Interactions API miliknya, yang berfungsi sebagai laluan lalai (default) untuk aliran kerja ini. API tersebut mengekalkan sejarah sesi dan konteks, membolehkan sehingga tiga suntingan berturut-turut, menjadikan proses kreatif terasa lebih seperti dialog berterusan dengan AI. Untuk menunjukkan keupayaan ini, Google telah melancarkan tiga aplikasi demo: "Anywhere" untuk animasi pelancongan, "Space Lift" untuk reka bentuk dalaman, dan "Omni Product Studio" untuk penjanaan video e-dagang.

Seperti semua model generatif Google, kedua-dua Nano Banana 2 Lite dan Gemini Omni Flash menggunakan penanda air (watermarking) SynthID untuk memastikan kandungan janaan AI boleh disahkan di seluruh platform Google.

Ringkasan Utama

  • Kecekapan pada Skala Besar: Nano Banana 2 Lite menjana imej 1K dalam masa empat saat dengan hanya $0.034, mengoptimumkan aliran kerja untuk keperluan berkapasiti tinggi.
  • Penyuntingan Video Multimodal: Gemini Omni Flash memperkenalkan penjanaan dan penyuntingan video bahasa tabii ke dalam Gemini API pada harga $0.10 sesaat.
  • Saluran Kreatif Bersepadu: Pembangun boleh merantaikan model imej dan video melalui Interactions API untuk mengubah aset statik kepada kandungan animasi dengan lancar.