Google Yazindua Nano Banana 2 Lite na Gemini Omni Flash API
Google imepanua mfumo wake wa AI ya kuzalisha (generative AI) kwa kutoa mifano miwili mipya yenye nguvu iliyoundwa kupunguza ucheleweshaji (latency) na kufungua ubunifu wa filamu. Kwa kuleta Nano Banana 2 Lite kwa ajili ya uzalishaji wa picha kwa kasi ya juu na Gemini Omni Flash kwa ajili ya uundaji wa video, Google inawapa watengenezaji (developers) njia rahisi ya kuhama kutoka kwa dhana tuli hadi kwenye vyombo vya habari vinavyocheza.
Nano Banana 2 Lite: Uzalishaji wa Picha wa Kasi ya Juu
Google inawalenga watengenezaji wanaohitaji kasi na ufanisi wa gharama kwa kuzindua Nano Banana 2 Lite (kitaalamu inatambulika kwenye API kama gemini-3.1-flash-lite-image). Mfano huu umeundwa mahususi kwa ajili ya uundaji wa mawazo ya haraka na mifumo ya uzalishaji wa kiasi kikubwa, ukiwa na uwezo wa kuzalisha picha zenye azimio (resolution) la 1K ndani ya sekunde nne tu.
Kwa bei ya $0.034 kwa kila picha, Nano Banana 2 Lite inatoa faida kubwa ya kiuchumi kwa kampuni zinazoendesha mifumo mikubwa ya uzalishaji wa picha. Licha ya kasi yake iliyoboreshwa, Google inadai kuwa mfano huu unadumisha viwango vya juu vya kufuata maelekezo (prompt following), uthabiti wa wahusika, na usomaji wa maandishi. Mfano huu unakamilisha ngazi tatu za utaratibu:
- Nano Banana 2 Lite: Inajikita kwenye kasi ya juu sana na gharama nafuu.
- Nano Banana 2 (Gemini 3.1 Flash Image): "Mtaalamu wa kila kitu" mwenye uwezo mbalimbali.
- Nano Banana Pro (Gemini 3.1 Pro Image): Imeundwa kwa ajili ya uwezo wa kufikiri wa kiwango cha kitaalamu na udhibiti tata.
Mfano huu si kwa ajili ya watengenezaji pekee; unajumuishwa katika mfumo mzima wa Google, ikijumuisha Google Search (AI Mode), NotebookLM, Google Photos, na Google Ads.
Gemini Omni Flash: Kuleta Video kwenye API
Baada ya kuonyeshwa kwa mara ya kwanza kwenye Google I/O, Gemini Omni Flash sasa inapatikana rasmi kupitia Gemini API na Google AI Studio. Mfano huu unawakilisha hatua kubwa katika uwezo wa kufikiri wa aina mbalimbali (multimodal reasoning), ukiruhusu watengenezaji kuzalisha na kuhariri video kwa kutumia maelekezo ya lugha ya kawaida. Kwa bei ya $0.10 kwa kila sekunde ya video inayozalishwa, inashindana vyema na Veo 3.1 Fast.
Gemini Omni Flash inafanya vizuri sana katika "uhariri wa video wa mazungumzo" (conversational video editing), ambapo watumiaji wanaweza kuboresha vipande vya video kwa kutumia maandishi, picha, au video iliyopo kama chanzo. Ingawa vikwazo vya sasa ni pamoja na urefu wa juu wa kipande cha sekunde 10 na uthabiti mdogo wa wahusika wakati wa miondoko tata ya kamera, uwezo wa mfano huu kuoanisha maandishi na michoro na matendo ya video unawakilisha hatua muhimu kuelekea uundaji wa maudhui unaoendeshwa na AI.
Nguvu ya Model Chaining na Interactions API
Thamani halisi ya kimkakati ya toleo hili iko katika ushirikiano kati ya mifano hii miwili. Google inahimiza mtindo wa kazi wa "chaining": watengenezaji wanaweza kutumia Nano Banana 2 Lite kuzalisha picha ya rejeleo ya hali ya juu papo hapo na kisha kuingiza picha hiyo kwenye Gemini Omni Flash ili kuifanya iwe video inayocheza.
Ili kurahisisha hili, Google inatangaza Interactions API yake, ambayo inatumika kama chaguo la kawaida kwa mifumo hii ya kazi. API hii inahifadhi historia ya kikao na muktadha, ikiruhusu hadi marekebisho matatu mfululizo, jambo linalofanya mchakato wa ubunifu kuhisi kama mazungumzo endelevu na AI. Ili kuonyesha uwezo huu, Google imezindua programu tatu za majaribio: "Anywhere" kwa ajili ya uhuishaji wa safari, "Space Lift" kwa ajili ya usanifu wa ndani, na "Omni Product Studio" kwa ajili ya uzalishaji wa video za biashara ya mtandaoni.
Kama ilivyo kwa mifano yote ya kuzalisha ya Google, Nano Banana 2 Lite na Gemini Omni Flash zote zinatumia alama ya SynthID (SynthID watermarking) ili kuhakikisha maudhui yanayozalishwa na AI yanaweza kuthibitishwa kwenye majukwaa ya Google.
Mambo Muhimu ya Kuzingatia
- Ufanisi katika Kiwango Kikubwa: Nano Banana 2 Lite inatoa picha za 1K ndani ya sekunde nne kwa gharama ya $0.034 tu, ikiboresha mifumo ya kazi kwa mahitaji ya uzalishaji mkubwa.
- Uhariri wa Video wa Multimodal: Gemini Omni Flash inaleta uwezo wa kuzalisha na kuhariri video kwa lugha ya kawaida kwenye Gemini API kwa gharama ya $0.10 kwa sekunde.
- Mfumo Jumuishi wa Ubunifu: Watengenezaji wanaweza kuunganisha mifano ya picha na video kupitia Interactions API ili kubadilisha mali tuli kuwa maudhui yanayocheza bila matatizo.
