Google запускає Nano Banana 2 Lite та Gemini Omni Flash API
Google розширила свою екосистему генеративного ШІ, випустивши дві потужні нові моделі, розроблені для мінімізації затримок та розкриття кінематографічної креативності. Впроваджуючи Nano Banana 2 Lite для високошвидкісної генерації зображень та Gemini Omni Flash для синтезу відео, Google надає розробникам оптимізований конвеєр для переходу від статичних концепцій до динамічного медіаконтенту.
Nano Banana 2 Lite: Високопродуктивна генерація зображень
Google орієнтується на запит розробників щодо швидкості та економічної ефективності, запускаючи Nano Banana 2 Lite (технічно ідентифіковану в API як gemini-3.1-flash-lite-image). Ця модель спеціально створена для швидкого генерування ідей та високооб'ємних виробничих конвеєрів, здатна створювати зображення з роздільною здатністю 1K всього за чотири секунди.
За ціною $0,034 за зображення, Nano Banana 2 Lite пропонує значну економічну перевагу для компаній, що використовують масштабні робочі процети генерації зображень. Попри оптимізовану швидкість, Google стверджує, що модель підтримує високі стандарти дотримання промптів, послідовності персонажів та читабельності тексту. Ця модель завершує трирівневу ієрархію:
- Nano Banana 2 Lite: орієнтована на надзвичайну швидкість та низьку вартість.
- Nano Banana 2 (Gemini 3.1 Flash Image): універсальна модель «для всього».
- Nano Banana Pro (Gemini 3.1 Pro Image): розроблена для міркувань професійного рівня та складного керування.
Модель призначена не лише для розробників; вона інтегрується в екосистему Google, включаючи Google Search (AI Mode), NotebookLM, Google Photos та Google Ads.
Gemini Omni Flash: Відео в API
Після попереднього показу на Google I/O, Gemini Omni Flash тепер офіційно доступна через Gemini API та Google AI Studio. Ця модель є стрибком у мультимодальному міркуванні, дозволяючи розробникам генерувати та редагувати відео за допомогою промптів природною мовою. За ціною $0,10 за секунду відеовиходу, вона є конкурентоспроможною нарівні з Veo 3.1 Fast.
Gemini Omni Flash демонструє чудові результати у «розмовному редагуванні відео», де користувачі можуть вдосконалювати кліпи, використовуючи текст, зображення або наявне відео як вхідні дані. Хоча поточні обмеження включають максимальну тривалість кліпу 10 секунд та обмежену послідовність персонажів під час складних рухів камери, здатність моделі синхронізувати текст і графіку з діями у відео є значним кроком вперед для створення контенту за допомогою ШІ.
Потужність ланцюжкових моделей та Interactions API
Справжня стратегічна цінність цього релізу полягає в синергії між двома моделями. Google заохочує робочий процес «ланцюжкового» типу (chaining): розробники можуть використовувати Nano Banana 2 Lite для миттєвої генерації високоякісного референсного зображення, а потім подавати це зображення в Gemini Omni Flash, щоб анімувати його у відео.
Щоб полегшити це, Google просуває свій Interactions API, який слугує стандартом для таких робочих процесів. API зберігає історію сесій та контекст, дозволяючи виконувати до трьох послідовних редагувань, завдяки чому творчий процес стає схожим на безперервний діалог із ШІ. Щоб продемонструвати ці можливості, Google запустила три демо-додатки: «Anywhere» для анімації подорожей, «Space Lift» для дизайну інтер'єру та «Omni Product Studio» для генерації відео в електронній комерції.
Як і всі генеративні моделі Google, Nano Banana 2 Lite та Gemini Omni Flash використовують водяні знаки SynthID, щоб гарантувати можливість перевірки контенту, створеного ШІ, на платформах Google.
Основні висновки
- Ефективність у масштабі: Nano Banana 2 Lite створює зображення 1K за чотири секунди всього за $0,034, оптимізуючи робочі процеси для потреб високої пропускної здатності.
- Мультимодальне редагування відео: Gemini Omni Flash впроваджує генерацію та редагування відео природною мовою в Gemini API за ціною $0,10 за секунду.
- Інтегрований творчий конвеєр: Розробники можуть поєднувати моделі зображень та відео через Interactions API, щоб плавно перетворювати статичні активи на анімований контент.
