Google, Nano Banana 2 Lite ve Gemini Omni Flash API'yi Tanıttı

Google, gecikme sürelerini azaltmak ve sinematik yaratıcılığın kapılarını aralamak için tasarlanan iki güçlü yeni modelin yayınlanmasıyla üretken yapay zeka ekosistemini genişletti. Yüksek hızlı görsel oluşturma için Nano Banana 2 Lite'ı ve video sentezi için Gemini Omni Flash'ı sunan Google, geliştiricilere statik kavramlardan hareketli medyaya geçiş yapabilecekleri optimize edilmiş bir iş akışı sağlıyor.

Nano Banana 2 Lite: Yüksek Verimli Görsel Oluşturma

Google, Nano Banana 2 Lite'ı (API'de teknik olarak gemini-3.1-flash-lite-image olarak tanımlanır) piyasaya sürerek geliştiricilerin hız ve maliyet verimliliği taleplerini hedefliyor. Bu model, hızlı fikir geliştirme ve yüksek hacimli üretim iş akışları için özel olarak üretilmiştir ve sadece dört saniyede 1K çözünürlüğünde görseller oluşturabilmektedir.

Görsel başına 0,034 $ gibi bir fiyat noktasıyla Nano Banana 2 Lite, devasa görsel oluşturma iş akışları yürüten şirketler için önemli bir ekonomik avantaj sunuyor. Optimize edilmiş hızına rağmen Google, modelin istem takibi (prompt following), karakter tutarlılığı ve metin okunabilirliği konularında yüksek standartları koruduğunu iddia ediyor. Bu model, üç katmanlı bir hiyerarşiyi tamamlıyor:

  • Nano Banana 2 Lite: Aşırı hız ve düşük maliyete odaklanır.
  • Nano Banana 2 (Gemini 3.1 Flash Image): Çok yönlü "her işe uygun" model.
  • Nano Banana Pro (Gemini 3.1 Pro Image): Profesyonel düzeyde muhakeme ve karmaşık kontrol için tasarlanmıştır.

Model sadece geliştiriciler için değil; Google Search (AI Mode), NotebookLM, Google Photos ve Google Ads dahil olmak üzere tüm Google ekosistemine entegre ediliyor.

Gemini Omni Flash: Videoyu API'ye Getiriyor

Google I/O'daki ön gösteriminin ardından Gemini Omni Flash, artık Gemini API ve Google AI Studio üzerinden resmi olarak kullanılabiliyor. Bu model, geliştiricilerin doğal dil istemlerini kullanarak video oluşturmasına ve düzenlemesine olanak tanıyan çok modlu (multimodal) muhakemede bir sıçramayı temsil ediyor. Video çıktısının saniyesi başına 0,10 $ olarak fiyatlandırılan model, Veo 3.1 Fast ile rekabetçi bir konumda yer alıyor.

Gemini Omni Flash, kullanıcıların metin, görüntü veya mevcut videoları girdi olarak kullanarak klipleri geliştirebildiği "sohbet tabanlı video düzenleme" konusunda oldukça başarılıdır. Mevcut sınırlamalar arasında 10 saniyelik maksimum klip uzunluğu ve karmaşık kamera hareketlerinde sınırlı karakter tutarlılığı yer alsa da, modelin metin ve grafikleri video eylemleriyle senkronize etme yeteneği, yapay zeka destekli içerik üretimi için önemli bir adım teşkil ediyor.

Model Zincirleme ve Interactions API'nin Gücü

Bu sürümün asıl stratejik değeri, iki model arasındaki sinerjide yatıyor. Google, bir "zincirleme" (chaining) iş akışını teşvik ediyor: Geliştiriciler, yüksek kaliteli bir referans görselini anında oluşturmak için Nano Banana 2 Lite'ı kullanabilir ve ardından bu görseli videoya dönüştürmek için Gemini Omni Flash'a aktarabilir.

Bunu kolaylaştırmak için Google, bu iş akışları için varsayılan olarak hizmet veren Interactions API'sini öne çıkarıyor. API, oturum geçmişini ve bağlamı koruyarak art arda üç düzenlemeye kadar olanak tanıyor ve böylece yaratıcı sürecin yapay zeka ile sürekli bir diyalog gibi hissedilmesini sağlıyor. Bu yetenekleri sergilemek için Google üç demo uygulama başlattı: Seyahat animasyonu için "Anywhere", iç mekan tasarımı için "Space Lift" ve e-ticaret video üretimi için "Omni Product Studio".

Tüm Google üretken modellerinde olduğu gibi, hem Nano Banana 2 Lite hem de Gemini Omni Flash, yapay zeka tarafından oluşturulan içeriğin Google platformlarında doğrulanabilmesini sağlamak için SynthID filigranlama teknolojisini kullanıyor.

Önemli Çıkarımlar

  • Ölçeklenebilir Verimlilik: Nano Banana 2 Lite, yüksek verimli ihtiyaçlar için iş akışlarını optimize ederek sadece 0,034 $ karşılığında dört saniyede 1K görseller sunar.
  • Çok Modlu Video Düzenleme: Gemini Omni Flash, saniye başına 0,10 $ fiyatla Gemini API'ye doğal dil ile video oluşturma ve düzenleme yeteneği getiriyor.
  • Entegre Yaratıcı İş Akışı: Geliştiriciler, statik varlıkları sorunsuz bir şekilde hareketli içeriğe dönüştürmek için Interactions API aracılığıyla görsel ve video modellerini birbirine bağlayabilir.