Google نے Nano Banana 2 Lite اور Gemini Omni Flash API لانچ کر دی ہے
Google نے دو طاقتور نئے ماڈلز کے ذریعے اپنے جنریٹیو AI (generative AI) ایکو سسٹم کو وسعت دی ہے، جنہیں لیٹنسی (latency) کو کم کرنے اور سینیمیٹک تخلیقی صلاحیتوں کو اجاگر کرنے کے لیے ڈیزائن کیا گیا ہے۔ تیز رفتار امیج جنریشن کے لیے Nano Banana 2 Lite اور ویڈیو سنتھیسز (video synthesis) کے لیے Gemini Omni Flash متعارف کروا کر، Google ڈویلپرز کو ساکن تصورات سے متحرک میڈیا تک منتقل ہونے کے لیے ایک ہموار پائپ لائن فراہم کر رہا ہے۔
Nano Banana 2 Lite: ہائی تھرو پٹ امیج جنریشن
Google نے Nano Banana 2 Lite (جسے تکنیکی طور پر API میں gemini-3.1-flash-lite-image کے طور پر پہچانا جاتا ہے) کے لانچ کے ساتھ رفتار اور لاگت کی بچت کے لیے ڈویلپرز کی طلب کو نشانہ بنایا ہے۔ یہ ماڈل تیز رفتار آئیڈیاز اور زیادہ حجم والی پروڈکشن پائپ لائنز کے لیے خاص طور پر بنایا گیا ہے، جو محض چار سیکنڈ میں 1K ریزولوشن والی تصاویر تیار کرنے کی صلاحیت رکھتا ہے۔
$0.034 فی تصویر کی قیمت پر، Nano Banana 2 Lite ان کمپنیوں کے لیے ایک اہم معاشی فائدہ فراہم کرتا ہے جو بڑے پیمانے پر امیج جنریشن ورک فلو چلا رہی ہیں۔ اپنی بہتر رفتار کے باوجود، Google کا دعویٰ ہے کہ یہ ماڈل پرامپٹ فالوونگ (prompt following)، کرداروں کے تسلسل (character consistency) اور متن کی پڑھنے کی صلاحیت (text readability) کے اعلیٰ معیار کو برقرار رکھتا ہے۔ یہ ماڈل ایک تین درجوں والی درجہ بندی کو مکمل کرتا ہے:
- Nano Banana 2 Lite: انتہائی رفتار اور کم لاگت پر مرکوز۔
- Nano Banana 2 (Gemini 3.1 Flash Image): ایک ہمہ گیر "آل راؤنڈر"۔
- Nano Banana Pro (Gemini 3.1 Pro Image): پیشہ ورانہ معیار کی منطق اور پیچیدہ کنٹرول کے لیے ڈیزائن کیا گیا ہے۔
یہ ماڈل صرف ڈویلپرز کے لیے نہیں ہے؛ اسے Google کے پورے ایکو سسٹم میں شامل کیا جا رہا ہے، بشمول Google Search (AI Mode)، NotebookLM، Google Photos، اور Google Ads۔
Gemini Omni Flash: API میں ویڈیو کا اضافہ
Google I/O میں اپنے پری ویو کے بعد، Gemini Omni Flash اب باضابطہ طور پر Gemini API اور Google AI Studio کے ذریعے دستیاب ہے۔ یہ ماڈل ملٹی موڈل ریزننگ (multimodal reasoning) میں ایک بڑی چھلانگ کی نمائندگی کرتا ہے، جو ڈویلپرز کو قدرتی زبان کے پرامپٹس کا استعمال کرتے ہوئے ویڈیو تیار کرنے اور ایڈٹ کرنے کی اجازت دیتا ہے۔ $0.10 فی سیکنڈ ویڈیو آؤٹ پٹ کی قیمت کے ساتھ، یہ Veo 3.1 Fast کے مقابلے میں مضبوط پوزیشن رکھتا ہے۔
Gemini Omni Flash "گفتگو کے ذریعے ویڈیو ایڈیٹنگ" (conversational video editing) میں مہارت رکھتا ہے، جہاں صارفین متن، تصاویر، یا موجودہ ویڈیو کو بطور ان پٹ استعمال کرتے ہوئے کلپس کو بہتر بنا سکتے ہیں۔ اگرچہ موجودہ حدود میں 10 سیکنڈ کی زیادہ سے زیادہ کلپ کی لمبائی اور پیچیدہ کیمرہ حرکات کے دوران محدود کرداروں کا تسلسل شامل ہے، لیکن ویڈیو ایکشنز کے ساتھ متن اور گرافکس کو ہم آہنگ کرنے کی ماڈل کی صلاحیت AI سے چلنے والی مواد کی تخلیق کے لیے ایک اہم قدم ہے۔
ماڈل چیننگ اور Interactions API کی طاقت
اس ریلیز کی اصل تزویراتی اہمیت دونوں ماڈلز کے درمیان ہم آہنگی میں پنہاں ہے۔ Google ایک "چیننگ" (chaining) ورک فلو کی حوصلہ افزائی کر رہا ہے: ڈویلپرز Nano Banana 2 Lite کو فوری طور پر ایک اعلیٰ معیار کی ریفرنس امیج تیار کرنے کے لیے استعمال کر سکتے ہیں اور پھر اس امیج کو Gemini Omni Flash میں ڈال کر اسے ویڈیو میں تبدیل کر سکتے ہیں۔
اس کی سہولت کے لیے، Google اپنی Interactions API کو فروغ دے رہا ہے، جو ان ورک فلو کے لیے ڈیفالٹ کے طور پر کام کرتی ہے۔ یہ API سیشن کی ہسٹری اور سیاق و سباق (context) کو محفوظ رکھتی ہے، جس سے مسلسل تین ایڈٹس تک ممکن ہو جاتے ہیں، جس سے تخلیقی عمل AI کے ساتھ ایک مسلسل مکالمے کی طرح محسوس ہوتا ہے۔ ان صلاحیتوں کے مظاہرے کے لیے، Google نے تین ڈیمو ایپس لانچ کی ہیں: ٹریول اینیمیشن کے لیے "Anywhere"، انٹیریئر ڈیزائن کے لیے "Space Lift"، اور ای کامرس ویڈیو جنریشن کے لیے "Omni Product Studio"۔
تمام Google جنریٹیو ماڈلز کی طرح، Nano Banana 2 Lite اور Gemini Omni Flash دونوں SynthID واٹر مارکنگ کا استعمال کرتے ہیں تاکہ اس بات کو یقینی بنایا جا سکے کہ AI سے تیار کردہ مواد کو Google کے پلیٹ فارمز پر تصدیق کی جا سکے۔
اہم نکات
- مقدار کے لحاظ سے کارکردگی: Nano Banana 2 Lite محض $0.034 میں چار سیکنڈ میں 1K تصاویر فراہم کرتا ہے، جو ہائی تھرو پٹ کی ضروریات کے لیے ورک فلو کو بہتر بناتا ہے۔
- ملٹی موڈل ویڈیو ایڈیٹنگ: Gemini Omni Flash $0.10 فی سیکنڈ پر Gemini API میں قدرتی زبان کے ذریعے ویڈیو جنریشن اور ایڈیٹنگ متعارف کرواتا ہے۔
- مربوط تخلیقی پائپ لائن: ڈویلپرز ساکن اثاثوں کو ہموار طریقے سے اینیمیٹڈ مواد میں تبدیل کرنے کے لیے Interactions API کے ذریعے امیج اور ویڈیو ماڈلز کو چین کر سکتے ہیں۔
