Google تطلق Nano Banana 2 Lite و Gemini Omni Flash API
وسعت Google منظومة الذكاء الاصطناعي التوليدي الخاصة بها بإطلاق نموذجين جديدين قويين صُمما لتقليل زمن الاستجابة (latency) وفتح آفاق الإبداع السينمائي. ومن خلال تقديم Nano Banana 2 Lite لتوليد الصور بسرعة عالية و Gemini Omni Flash لتخليق الفيديو، توفر Google للمطورين مسار عمل انسيابي للانتقال من المفاهيم الثابتة إلى الوسائط المتحركة.
Nano Banana 2 Lite: توليد صور بإنتاجية عالية
تستهدف Google طلب المطورين للسرعة وكفاءة التكلفة من خلال إطلاق Nano Banana 2 Lite (المعرف تقنيًا في واجهة برمجة التطبيقات باسم gemini-3.1-flash-lite-image). هذا النموذج مصمم خصيصًا لعمليات العصف الذهني السريع ومسارات الإنتاج عالية الحجم، وهو قادر على توليد صور بدقة 1K في أربع ثوانٍ فقط.
بسعر 0.034 دولار لكل صورة، يوفر Nano Banana 2 Lite ميزة اقتصادية كبيرة للشركات التي تدير مسارات عمل ضخمة لتوليد الصور. ورغم سرعته المحسنة، تزعم Google أن النموذج يحافظ على معايير عالية في اتباع الأوامر (prompt following)، واتساق الشخصيات، ووضوح النصوص. ويتمم هذا النموذج تسلسلاً هرميًا ثلاثي المستويات:
- Nano Banana 2 Lite: يركز على السرعة الفائقة والتكلفة المنخفضة.
- Nano Banana 2 (Gemini 3.1 Flash Image): النموذج "الشامل" متعدد الاستخدامات.
- Nano Banana Pro (Gemini 3.1 Pro Image): مصمم للاستنتاج بمستوى احترافي والتحكم المعقد.
هذا النموذج ليس للمطورين فحسب؛ بل يتم دمجه عبر منظومة Google، بما في ذلك Google Search (وضع الذكاء الاصطناعي)، وNotebookLM، وGoogle Photos، وGoogle Ads.
Gemini Omni Flash: جلب الفيديو إلى واجهة برمجة التطبيقات (API)
بعد عرضه الأولي في مؤتمر Google I/O، أصبح Gemini Omni Flash متاحًا الآن رسميًا عبر Gemini API وGoogle AI Studio. يمثل هذا النموذج قفزة في الاستنتاج متعدد الوسائط (multimodal reasoning)، مما يسمح للمطورين بتوليد وتحرير الفيديو باستخدام أوامر باللغة الطبيعية. وبسعر 0.10 دولار لكل ثانية من الفيديو الناتج، فإنه ينافس بقوة نموذج Veo 3.1 Fast.
يتميز Gemini Omni Flash بـ "تحرير الفيديو الحواري"، حيث يمكن للمستخدمين تحسين المقاطع باستخدام النصوص أو الصور أو الفيديو الحالي كمدخلات. ورغم أن القيود الحالية تشمل حدًا أقصى لطول المقطع يبلغ 10 ثوانٍ واتساقًا محدودًا للشخصيات عبر حركات الكاميرا المعقدة، إلا أن قدرة النموذج على مزامنة النصوص والرسومات مع حركات الفيديو تمثل خطوة كبيرة للأمام في إنشاء المحتوى المدعوم بالذكاء الاصطناعي.
قوة تسلسل النماذج (Model Chaining) وواجهة برمجة تطبيقات Interactions API
تكمن القيمة الاستراتيجية الحقيقية لهذا الإصدار في التآزر بين النموذجين. تشجع Google سير عمل يعتمد على "التسلسل" (chaining): حيث يمكن للمطورين استخدام Nano Banana 2 Lite لتوليد صورة مرجعية عالية الجودة فورًا، ثم تغذية تلك الصورة في Gemini Omni Flash لتحويلها إلى فيديو متحرك.
ولتسهيل ذلك، تروج Google لواجهة برمجة تطبيقات Interactions API، والتي تعمل كخيار افتراضي لسير العمل هذا. تحافظ واجهة برمجة التطبيقات على سجل الجلسة والسياق، مما يسمح بما يصل إلى ثلاث عمليات تحرير متتالية، مما يجعل العملية الإبداعية تبدو وكأنها حوار مستمر مع الذكاء الاصطناعي. ولإثبات هذه القدرات، أطلقت Google ثلاثة تطبيقات تجريبية: "Anywhere" للرسوم المتحركة الخاصة بالسفر، و"Space Lift" للتصميم الداخلي، و"Omni Product Studio" لتوليد فيديوهات التجارة الإلكترونية.
وكما هو الحال مع جميع نماذج Google التوليدية، يستخدم كل من Nano Banana 2 Lite و Gemini Omni Flash تقنية العلامات المائية SynthID لضمان إمكانية التحقق من المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي عبر منصات Google.
النقاط الرئيسية
- الكفاءة على نطاق واسع: يوفر Nano Banana 2 Lite صورًا بدقة 1K في أربع ثوانٍ مقابل 0.034 دولار فقط، مما يحسن سير العمل للاحتياجات ذات الإنتاجية العالية.
- تحرير الفيديو متعدد الوسائط: يقدم Gemini Omni Flash ميزة توليد وتحرير الفيديو باللغة الطبيعية إلى Gemini API بسعر 0.10 دولار لكل ثانية.
- مسار إبداعي متكامل: يمكن للمطورين تسلسل نماذج الصور والفيديو عبر Interactions API لتحويل الأصول الثابتة إلى محتوى متحرك بسلاسة.
