Google ने Nano Banana 2 Lite आणि Gemini Omni Flash API लाँच केले

Google ने लेटन्सी (latency) कमी करण्यासाठी आणि सिनेमॅटिक सर्जनशीलता अनलॉक करण्यासाठी डिझाइन केलेल्या दोन शक्तिशाली नवीन मॉडेल्सच्या విడుदेसह आपल्या जनरेटिव्ह AI इकोसिस्टमचा विस्तार केला आहे. हाय-स्पीड इमेज जनरेशनसाठी Nano Banana 2 Lite आणि व्हिडिओ सिंथेसिससाठी Gemini Omni Flash सादर करून, Google डेव्हलपर्सना स्थिर संकल्पनांपासून (static concepts) हालचाल करणाऱ्या मीडियापर्यंत पोहोचण्यासाठी एक सुव्यवस्थित पाइपलाइन प्रदान करत आहे.

Nano Banana 2 Lite: हाय-थ्रूपुट इमेज जनरेशन

Google Nano Banana 2 Lite (तांत्रिकदृष्ट्या API मध्ये gemini-3.1-flash-lite-image म्हणून ओळखले जाते) च्या लाँचसह वेग आणि किफायतशीरपणासाठी डेव्हलपर्सची मागणी पूर्ण करण्याचे लक्ष्य ठेवत आहे. हे मॉडेल जलद कल्पना सुचवण्यासाठी (rapid ideation) आणि हाय-व्हॉल्यूम प्रोडक्शन पाइपलाइनसाठी खास बनवले आहे, जे केवळ चार सेकंदात 1K रिझोल्यूशनच्या प्रतिमा तयार करण्यास सक्षम आहे.

प्रति इमेज $0.034 च्या किमतीत, Nano Banana 2 Lite मोठ्या प्रमाणावर इमेज-जनरेशन वर्कफ्लो चालवणाऱ्या कंपन्यांसाठी महत्त्वपूर्ण आर्थिक फायदा देते. त्याचा वेग ऑप्टिमाइझ केलेला असूनही, Google चा दावा आहे की हे मॉडेल प्रॉम्प्ट फॉलो करणे (prompt following), कॅरेक्टर कन्सिस्टन्सी आणि मजकुराची वाचनीयता यांसाठी उच्च मान राखते. हे मॉडेल तीन-स्तरीय श्रेणी पूर्ण करते:

  • Nano Banana 2 Lite: अत्यंत वेग आणि कमी खर्चावर लक्ष केंद्रित करते.
  • Nano Banana 2 (Gemini 3.1 Flash Image): अष्टपैलू "ऑल-राउंडर".
  • Nano Banana Pro (Gemini 3.1 Pro Image): प्रोफेशनल-ग्रेड रिझनिंग आणि जटिल नियंत्रणासाठी डिझाइन केलेले.

हे मॉडेल केवळ डेव्हलपर्ससाठी नाही; ते Google Search (AI Mode), NotebookLM, Google Photos आणि Google Ads सह संपूर्ण Google इकोसिस्टममध्ये समाविष्ट केले जात आहे.

Gemini Omni Flash: API मध्ये व्हिडिओ आणत आहे

Google I/O मधील प्रीव्ह्यूनंतर, Gemini Omni Flash आता अधिकृतपणे Gemini API आणि Google AI Studio द्वारे उपलब्ध आहे. हे मॉडेल मल्टीमोडल रिझनिंगमध्ये मोठी झेप घेते, ज्यामुळे डेव्हलपर्स नैसर्गिक भाषा प्रॉम्प्ट्सचा (natural language prompts) वापर करून व्हिडिओ तयार करू आणि एडिट करू शकतात. प्रति सेकंद व्हिडिओ आउटपुट $0.10 किमतीत, हे Veo 3.1 Fast च्या बरोबरीने स्पर्धात्मक स्थितीत आहे.

Gemini Omni Flash "कन्व्हर्सेशनल व्हिडिओ एडिटिंग" मध्ये उत्कृष्ट आहे, जिथे वापरकर्ते मजकूर, प्रतिमा किंवा विद्यमान व्हिडिओ इनपुट म्हणून वापरून क्लिप्स सुधारू शकतात. जरी सध्याच्या मर्यादांमध्ये १० सेकंदांची कमाल क्लिप लांबी आणि जटिल कॅमेरा हालचालींमध्ये मर्यादित कॅरेक्टर कन्सिस्टन्सी यांचा समावेश असला, तरी व्हिडिओ कृतींसोबत मजकूर आणि ग्राफिक्स सिंक करण्याची मॉडेलची क्षमता AI-चालित कंटेंट क्रिएशनसाठी एक महत्त्वपूर्ण पाऊल आहे.

मॉडेल चेनिंग आणि Interactions API ची शक्ती

या रिलीजचे खरे धोरणात्मक मूल्य दोन्ही मॉडेल्समधील समन्वयामध्ये (synergy) आहे. Google "चेनिंग" वर्कफ्लोला प्रोत्साहन देत आहे: डेव्हलपर्स Nano Banana 2 Lite वापरून त्वरित उच्च-गुणवत्तेची संदर्भ प्रतिमा तयार करू शकतात आणि नंतर ती प्रतिमा Gemini Omni Flash मध्ये टाकून त्याचे व्हिडिओमध्ये रूपांतर (animate) करू शकतात.

हे सुलभ करण्यासाठी, Google त्याच्या Interactions API ला प्रोत्साहन देत आहे, जे या वर्कफ्लोसाठी डिफॉल्ट म्हणून काम करते. हे API सेशन हिस्ट्री आणि कॉन्टेक्स्ट जपते, ज्यामुळे सलग तीन एडिट्स करणे शक्य होते, ज्यामुळे सर्जनशील प्रक्रिया AI सोबतच्या सततच्या संवादासारखी वाटते. या क्षमतांचे प्रदर्शन करण्यासाठी, Google ने तीन डेमो ॲप्स लाँच केले आहेत: ट्रॅव्हल ॲनिमेशनसाठी "Anywhere", इंटिरिअर डिझाइनसाठी "Space Lift" आणि ई-कॉमर्स व्हिडिओ जनरेशनसाठी "Omni Product Studio".

Google च्या सर्व जनरेटिव्ह मॉडेल्सप्रमाणे, Nano Banana 2 Lite आणि Gemini Omni Flash दोन्ही SynthID वॉटरमार्किंगचा वापर करतात, जेणेकरून AI-जनरेटेड कंटेंट Google प्लॅटफॉर्मवर सत्यापित केला जाऊ शकेल याची खात्री मिळते.

मुख्य मुद्दे

  • स्केलवरील कार्यक्षमता: Nano Banana 2 Lite केवळ $0.034 मध्ये चार सेकंदात 1K प्रतिमा देते, ज्यामुळे हाय-थ्रूपुट गरजांसाठी वर्कफ्लो ऑप्टिमाइझ होतो.
  • मल्टीमोडल व्हिडिओ एडिटिंग: Gemini Omni Flash प्रति सेकंद $0.10 दराने Gemini API मध्ये नैसर्गिक भाषा व्हिडिओ जनरेशन आणि एडिटिंगची सुविधा आणते.
  • एकात्मिक क्रिएटिव्ह पाइपलाइन: डेव्हलपर्स स्थिर मालमत्तांचे (static assets) सहजपणे ॲनिमेटेड कंटेंटमध्ये रूपांतर करण्यासाठी Interactions API द्वारे इमेज आणि व्हिडिओ मॉडेल्सचे चेनिंग करू शकतात.