Google Nano Banana 2 Lite এবং Gemini Omni Flash API লঞ্চ করেছে
ল্যাটেন্সি (latency) কমিয়ে আনতে এবং সিনেমাটিক সৃজনশীলতা উন্মোচন করতে দুটি শক্তিশালী নতুন মডেল রিলিজ করার মাধ্যমে Google তাদের জেনারেটিভ AI ইকোসিস্টেম সম্প্রসারিত করেছে। উচ্চ-গতির ইমেজ জেনারেশনের জন্য Nano Banana 2 Lite এবং ভিডিও সিন্থেসিসের জন্য Gemini Omni Flash প্রবর্তনের মাধ্যমে, Google ডেভেলপারদের স্ট্যাটিক কনসেপ্ট থেকে মুভিং মিডিয়ার দিকে যাওয়ার জন্য একটি সুবিন্যস্ত পাইপলাইন প্রদান করছে।
Nano Banana 2 Lite: হাই-থ্রুপুট ইমেজ জেনারেশন
Nano Banana 2 Lite (যা টেকনিক্যালি API-তে gemini-3.1-flash-lite-image হিসেবে চিহ্নিত) লঞ্চ করার মাধ্যমে Google গতি এবং খরচ-সাশ্রয়ী হওয়ার ক্ষেত্রে ডেভেলপারদের চাহিদাকে লক্ষ্য করে কাজ করছে। এই মডেলটি দ্রুত আইডিয়া তৈরি এবং উচ্চ-ভলিউম প্রোডাকশন পাইপলাইনের জন্য বিশেষভাবে তৈরি করা হয়েছে, যা মাত্র চার সেকেন্ডে 1K রেজোলিউশনের ইমেজ তৈরি করতে সক্ষম।
প্রতি ইমেজে $0.034 মূল্যের মাধ্যমে, Nano Banana 2 Lite সেইসব কোম্পানিগুলোর জন্য একটি উল্লেখযোগ্য অর্থনৈতিক সুবিধা প্রদান করে যারা বিশাল ইমেজ-জেনারেশন ওয়ার্কফ্লো পরিচালনা করে। এর অপ্টিমাইজড গতি সত্ত্বেও, Google দাবি করেছে যে মডেলটি প্রম্পট অনুসরণ (prompt following), ক্যারেক্টার কনসিস্টেন্সি এবং টেক্সট রিডাবিলিটির ক্ষেত্রে উচ্চ মান বজায় রাখে। এই মডেলটি একটি তিন-স্তরের শ্রেণিবিন্যাস সম্পন্ন করে:
- Nano Banana 2 Lite: চরম গতি এবং স্বল্প খরচের ওপর গুরুত্ব দেয়।
- Nano Banana 2 (Gemini 3.1 Flash Image): বহুমুখী "অল-রাউন্ডার"।
- Nano Banana Pro (Gemini 3.1 Pro Image): প্রফেশনাল-গ্রেড রিজনিং এবং জটিল নিয়ন্ত্রণের জন্য ডিজাইন করা হয়েছে।
এই মডেলটি শুধুমাত্র ডেভেলপারদের জন্য নয়; এটি Google Search (AI Mode), NotebookLM, Google Photos এবং Google Ads সহ পুরো Google ইকোসিস্টেম জুড়ে ইন্টিগ্রেট করা হচ্ছে।
Gemini Omni Flash: API-তে ভিডিও নিয়ে আসা
Google I/O-তে এর প্রিভিউ দেখানোর পর, Gemini Omni Flash এখন আনুষ্ঠানিকভাবে Gemini API এবং Google AI Studio-র মাধ্যমে উপলব্ধ। এই মডেলটি মাল্টিমোডাল রিজনিংয়ে একটি বড় লাফ হিসেবে কাজ করে, যা ডেভেলপারদের ন্যাচারাল ল্যাঙ্গুয়েজ প্রম্পট ব্যবহার করে ভিডিও তৈরি এবং এডিট করার সুবিধা দেয়। প্রতি সেকেন্ড ভিডিও আউটপুটের জন্য $0.10 মূল্যে এটি Veo 3.1 Fast-এর সাথে প্রতিযোগিতামূলক অবস্থানে রয়েছে।
Gemini Omni Flash "কনভারসেশনাল ভিডিও এডিটিং"-এ পারদর্শী, যেখানে ব্যবহারকারীরা টেক্সট, ইমেজ বা বিদ্যমান ভিডিও ইনপুট হিসেবে ব্যবহার করে ক্লিপগুলো আরও উন্নত করতে পারেন। যদিও বর্তমানে এর কিছু সীমাবদ্ধতা রয়েছে, যেমন সর্বোচ্চ ১০ সেকেন্ডের ক্লিপ দৈর্ঘ্য এবং জটিল ক্যামেরা মুভমেন্টের ক্ষেত্রে সীমিত ক্যারেক্টার কনসিস্টেন্সি, তবুও ভিডিও অ্যাকশনের সাথে টেক্সট এবং গ্রাফিক্স সিঙ্ক করার ক্ষমতা AI-চালিত কন্টেন্ট ক্রিয়েশনের ক্ষেত্রে একটি উল্লেখযোগ্য পদক্ষেপ।
মডেল চেইনিং এবং Interactions API-এর শক্তি
এই রিলিজের প্রকৃত কৌশলগত মূল্য লুকিয়ে আছে এই দুটি মডেলের সমন্বয়ের মধ্যে। Google একটি "চেইনিং" ওয়ার্কফ্লোকে উৎসাহিত করছে: ডেভেলপাররা Nano Banana 2 Lite ব্যবহার করে তাৎক্ষণিকভাবে একটি উচ্চ-মানের রেফারেন্স ইমেজ তৈরি করতে পারেন এবং তারপর সেই ইমেজটি Gemini Omni Flash-এ ইনপুট দিয়ে সেটিকে ভিডিওতে অ্যানিমেট করতে পারেন।
এটি সহজতর করতে, Google তাদের Interactions API-কে প্রচার করছে, যা এই ওয়ার্কফ্লোগুলোর জন্য ডিফল্ট হিসেবে কাজ করে। এই API সেশন হিস্ট্রি এবং কনটেক্সট সংরক্ষণ করে, যা টানা তিনটি এডিট করার সুবিধা দেয়, ফলে সৃজনশীল প্রক্রিয়াটি AI-এর সাথে একটি নিরবচ্ছিন্ন সংলাপের মতো মনে হয়। এই সক্ষমতাগুলো প্রদর্শনের জন্য Google তিনটি ডেমো অ্যাপ লঞ্চ করেছে: ট্রাভেল অ্যানিমেশনের জন্য "Anywhere", ইন্টেরিয়র ডিজাইনের জন্য "Space Lift", এবং ই-কমার্স ভিডিও জেনারেশনের জন্য "Omni Product Studio"।
Google-এর অন্যান্য সমস্ত জেনারেটিভ মডেলের মতো, Nano Banana 2 Lite এবং Gemini Omni Flash উভয়ই SynthID ওয়াটারমার্কিং ব্যবহার করে যাতে নিশ্চিত করা যায় যে AI-জেনারেটেড কন্টেন্ট Google প্ল্যাটফর্মগুলোতে যাচাই করা সম্ভব।
মূল বিষয়সমূহ
- বৃহৎ পরিসরে দক্ষতা (Efficiency at Scale): Nano Banana 2 Lite মাত্র $0.034 মূল্যে চার সেকেন্ডে 1K ইমেজ প্রদান করে, যা হাই-থ্রুপুট প্রয়োজনের জন্য ওয়ার্কফ্লো অপ্টিমাইজ করে।
- মাল্টিমোডাল ভিডিও এডিটিং: Gemini Omni Flash প্রতি সেকেন্ড $0.10 মূল্যে Gemini API-তে ন্যাচারাল ল্যাঙ্গুয়েজ ভিডিও জেনারেশন এবং এডিটিং সুবিধা নিয়ে এসেছে।
- সমন্বিত সৃজনশীল পাইপলাইন: ডেভেলপাররা Interactions API-এর মাধ্যমে ইমেজ এবং ভিডিও মডেলগুলোকে চেইন করতে পারেন যাতে স্ট্যাটিক অ্যাসেটগুলোকে নিরবচ্ছিন্নভাবে অ্যানিমেটেড কন্টেন্টে রূপান্তর করা যায়।
