Google Nano Banana 2 Lite-ഉം Gemini Omni Flash API-യും പുറത്തിറക്കി

ലേറ്റൻസി (latency) കുറയ്ക്കാനും സിനിമാറ്റിക് സർഗ്ഗാത്മകത വർദ്ധിപ്പിക്കാനും രൂപകൽപ്പന ചെയ്ത രണ്ട് കരുത്തുറ്റ പുതിയ മോഡലുകൾ പുറത്തിറക്കിക്കൊണ്ട് Google തങ്ങളുടെ ജനറേറ്റീവ് AI ഇക്കോസിസ്റ്റം വിപുലീകരിച്ചു. വേഗതയേറിയ ഇമേജ് ജനറേഷനായി Nano Banana 2 Lite-ഉം വീഡിയോ സിന്തസിസിനായി Gemini Omni Flash-ഉം അവതരിപ്പിക്കുന്നതിലൂടെ, സ്റ്റാറ്റിക് ആയ ആശയങ്ങളിൽ നിന്ന് ചലനാത്മകമായ മീഡിയയിലേക്കുള്ള മാറ്റത്തിന് ഡെവലപ്പർമാർക്ക് ലളിതമായ ഒരു പാത Google ഒരുക്കുന്നു.

Nano Banana 2 Lite: ഉയർന്ന അളവിലുള്ള ഇമേജ് ജനറേഷൻ (High-Throughput Image Generation)

വേഗതയ്ക്കും ചെലവ് കുറഞ്ഞ പ്രവർത്തനത്തിനും ഡെവലപ്പർമാർ നൽകുന്ന മുൻഗണന കണക്കിലെടുത്ത് Google Nano Banana 2 Lite (API-യിൽ gemini-3.1-flash-lite-image എന്ന് തിരിച്ചറിയപ്പെടുന്നു) പുറത്തിറക്കി. വേഗത്തിലുള്ള ആശയ രൂപീകരണത്തിനും (ideation) ഉയർന്ന അളവിലുള്ള പ്രൊഡക്ഷൻ ആവശ്യങ്ങൾക്കുമായി പ്രത്യേകം നിർമ്മിച്ച ഈ മോഡലിന് വെറും നാല് സെക്കൻഡിനുള്ളിൽ 1K റെസല്യൂഷൻ ചിത്രങ്ങൾ നിർമ്മിക്കാൻ കഴിയും.

ഓരോ ചിത്രത്തിനും $0.034 എന്ന നിരക്കിൽ, വൻതോതിലുള്ള ഇമേജ് ജനറേഷൻ വർക്ക്ഫ്ലോകൾ നടത്തുന്ന കമ്പനികൾക്ക് Nano Banana 2 Lite വലിയ സാമ്പത്തിക നേട്ടം വാഗ്ദാനം ചെയ്യുന്നു. വേഗത വർദ്ധിപ്പിച്ചിട്ടുണ്ടെങ്കിലും, പ്രോംപ്റ്റുകൾ കൃത്യമായി പാലിക്കാനും (prompt following), കഥാപാത്രങ്ങളുടെ സ്ഥിരത (character consistency), ടെക്സ്റ്റ് വ്യക്തത എന്നിവയിലും ഉയർന്ന നിലവാരം നിലനിർത്തുന്നുണ്ടെന്ന് Google അവകാശപ്പെടുന്നു. ഈ മോഡൽ ഒരു മൂന്ന് തലങ്ങളുള്ള ശ്രേണിയെ പൂർണ്ണമാക്കുന്നു:

  • Nano Banana 2 Lite: അങ്ങേയറ്റത്തെ വേഗതയ്ക്കും കുറഞ്ഞ ചെലവിനും മുൻഗണന നൽകുന്നു.
  • Nano Banana 2 (Gemini 3.1 Flash Image): വൈവിധ്യമാർന്ന ഉപയോഗങ്ങൾക്കുള്ള "ഓൾറൗണ്ടർ".
  • Nano Banana Pro (Gemini 3.1 Pro Image): പ്രൊഫഷണൽ നിലവാരത്തിലുള്ള റീസണിംഗിനും സങ്കീർണ്ണമായ നിയന്ത്രണങ്ങൾക്കുമായി രൂപകൽപ്പന ചെയ്തത്.

ഈ മോഡൽ ഡെവലപ്പർമാർക്ക് വേണ്ടി മാത്രമല്ല; Google Search (AI Mode), NotebookLM, Google Photos, Google Ads എന്നിവയുൾപ്പെടെയുള്ള Google ഇക്കോസിസ്റ്റം മുഴുവൻ ഇത് സംയോജിപ്പിക്കുന്നുണ്ട്.

Gemini Omni Flash: വീഡിയോ ഇനി API വഴിയും

Google I/O-യിലെ പ്രിവ്യൂവിന് ശേഷം, Gemini Omni Flash ഇപ്പോൾ Gemini API-യിലൂടെയും Google AI Studio-യിലൂടെയും ഔദ്യോഗികമായി ലഭ്യമാണ്. മൾട്ടിമോഡൽ റീസണിംഗിലെ (multimodal reasoning) വലിയൊരു കുതിച്ചുചാട്ടമാണ് ഈ മോഡൽ; സ്വാഭാവിക ഭാഷയിലുള്ള പ്രോംപ്റ്റുകൾ ഉപയോഗിച്ച് വീഡിയോകൾ നിർമ്മിക്കാനും എഡിറ്റ് ചെയ്യാനും ഇത് ഡെവലപ്പർമാരെ അനുവദിക്കുന്നു. വീഡിയോ ഔട്ട്പുട്ടിന്റെ ഓരോ സെക്കൻഡിലും $0.10 എന്ന നിരക്കിൽ ഇത് ലഭ്യമാണ്, ഇത് Veo 3.1 Fast-ന് സമാനമായ മത്സരസാധ്യതയുള്ള നിരക്കാണ്.

ടെക്സ്റ്റ്, ചിത്രങ്ങൾ അല്ലെങ്കിൽ നിലവിലുള്ള വീഡിയോകൾ എന്നിവ ഉപയോഗിച്ച് ക്ലിപ്പുകൾ പരിഷ്കരിക്കാൻ കഴിയുന്ന "കൺവർസേഷണൽ വീഡിയോ എഡിറ്റിംഗിൽ" (conversational video editing) Gemini Omni Flash മികച്ചുനിൽക്കുന്നു. നിലവിൽ 10 സെക്കൻഡ് പരമാവധി ക്ലിപ്പ് ദൈർഘ്യം, സങ്കീർണ്ണമായ ക്യാമറ ചലനങ്ങളിൽ കഥാപാത്രങ്ങളുടെ സ്ഥിരത കുറവ് എന്നിവ പരിമിതികളുണ്ടെങ്കിലും, ടെക്സ്റ്റും ഗ്രാഫിക്സും വീഡിയോയിലെ പ്രവർത്തനങ്ങളുമായി സമന്വയിപ്പിക്കാനുള്ള ഈ മോഡലിന്റെ കഴിവ് AI അധിഷ്ഠിത ഉള്ളടക്ക നിർമ്മാണത്തിൽ വലിയൊരു ചുവടുവെപ്പാണ്.

മോഡൽ ചെയിനിംഗിന്റെയും (Model Chaining) Interactions API-യുടെയും കരുത്ത്

ഈ റിലീസിന്റെ യഥാർത്ഥ തന്ത്രപരമായ മൂല്യം രണ്ട് മോഡലുകൾ തമ്മിലുള്ള പരസ്പര പൂരകമായ പ്രവർത്തനത്തിലാണ് (synergy). ഒരു "ചെയിനിംഗ്" (chaining) വർക്ക്ഫ്ലോ ആണ് Google പ്രോത്സാഹിപ്പിക്കുന്നത്: ഡെവലപ്പർമാർക്ക് Nano Banana 2 Lite ഉപയോഗിച്ച് ഉടനടി ഉയർന്ന നിലവാരമുള്ള ഒരു റഫറൻസ് ചിത്രം നിർമ്മിക്കാനും, തുടർന്ന് ആ ചിത്രം Gemini Omni Flash-ലേക്ക് നൽകി അതിനെ ഒരു വീഡിയോയായി മാറ്റാനും കഴിയും.

ഇത് എളുപ്പമാക്കുന്നതിനായി, ഈ വർക്ക്ഫ്ലോകൾക്കായി ഡിഫോൾട്ട് ആയി ഉപയോഗിക്കാവുന്ന Interactions API-യെ Google പ്രോത്സാഹിപ്പിക്കുന്നു. ഈ API സെഷൻ ഹിസ്റ്ററിയും കോൺടെക്സ്റ്റും നിലനിർത്തുന്നു, ഇത് തുടർച്ചയായ മൂന്ന് എഡിറ്റുകൾ വരെ സാധ്യമാക്കുന്നു. ഇത് സർഗ്ഗാത്മക പ്രക്രിയയെ AI-യുമായുള്ള ഒരു തുടർച്ചയായ സംഭാഷണം പോലെ തോന്നിപ്പിക്കുന്നു. ഈ കഴിവുകൾ പ്രകടിപ്പിക്കുന്നതിനായി Google മൂന്ന് ഡെമോ ആപ്പുകൾ പുറത്തിറക്കി: ട്രാവൽ ആനിമേഷനായി "Anywhere", ഇന്റീരിയർ ഡിസൈനായി "Space Lift", ഇ-കൊമേഴ്‌സ് വീഡിയോ ജനറേഷനായി "Omni Product Studio".

എല്ലാ Google ജനറേറ്റീവ് മോഡലുകളെയും പോലെ, Nano Banana 2 Lite-ഉം Gemini Omni Flash-ഉം SynthID വാട്ടർമാർക്കിംഗ് ഉപയോഗിക്കുന്നു. ഇത് AI നിർമ്മിച്ച ഉള്ളടക്കം Google പ്ലാറ്റ്‌ഫോമുകളിൽ പരിശോധിക്കപ്പെടുന്നുണ്ടെന്ന് ഉറപ്പാക്കുന്നു.

പ്രധാന കാര്യങ്ങൾ

  • Efficiency at Scale: Nano Banana 2 Lite വെറും $0.034 നിരക്കിൽ നാല് സെക്കൻഡിനുള്ളിൽ 1K ചിത്രങ്ങൾ നൽകുന്നു, ഇത് ഉയർന്ന അളവിലുള്ള ആവശ്യങ്ങൾക്കായി വർക്ക്ഫ്ലോകൾ ഒപ്റ്റിമൈസ് ചെയ്യുന്നു.
  • Multimodal Video Editing: Gemini Omni Flash സെക്കൻഡൊന്നിന് $0.10 നിരക്കിൽ സ്വാഭാവിക ഭാഷയിലുള്ള വീഡിയോ ജനറേഷനും എഡിറ്റിംഗും Gemini API-ലേക്ക് കൊണ്ടുവരുന്നു.
  • Integrated Creative Pipeline: സ്റ്റാറ്റിക് ആയ അസറ്റുകളെ അനിമേഷൻ ഉള്ളടക്കമാക്കി സുഗമമായി മാറ്റുന്നതിന് ഡെവലപ്പർമാർക്ക് Interactions API വഴി ഇമേജ്, വീഡിയോ മോഡലുകളെ ചെയിൻ ചെയ്യാൻ കഴിയും.