Google запускает Nano Banana 2 Lite и Gemini Omni Flash API

Google расширила свою экосистему генеративного ИИ, выпустив две новые мощные модели, предназначенные для резкого снижения задержек и раскрытия кинематографического потенциала. Представляя Nano Banana 2 Lite для высокоскоростной генерации изображений и Gemini Omni Flash для синтеза видео, Google предоставляет разработчикам оптимизированный конвейер для перехода от статических концепций к движущемуся медиаконтенту.

Nano Banana 2 Lite: высокопроизводительная генерация изображений

Google отвечает на запрос разработчиков на скорость и экономическую эффективность, запуская Nano Banana 2 Lite (технически идентифицируемую в API как gemini-3.1-flash-lite-image). Эта модель специально создана для быстрой проработки идей и высокообъемных производственных процессов; она способна генерировать изображения в разрешении 1K всего за четыре секунды.

При цене $0,034 за изображение Nano Banana 2 Lite предлагает значительное экономическое преимущество компаниям, использующим масштабные рабочие процессы генерации изображений. Несмотря на оптимизированную скорость, Google утверждает, что модель сохраняет высокие стандарты следования промптам, согласованности персонажей и читаемости текста. Эта модель завершает трехступенчатую иерархию:

  • Nano Banana 2 Lite: ориентирована на экстремальную скорость и низкую стоимость.
  • Nano Banana 2 (Gemini 3.1 Flash Image): универсальная модель «для всего».
  • Nano Banana Pro (Gemini 3.1 Pro Image): разработана для профессионального уровня рассуждений и сложного управления.

Модель предназначена не только для разработчиков; она интегрируется во всю экосистему Google, включая Google Search (режим AI), NotebookLM, Google Photos и Google Ads.

Gemini Omni Flash: видео в API

После предварительного показа на Google I/O модель Gemini Omni Flash теперь официально доступна через Gemini API и Google AI Studio. Эта модель представляет собой качественный скачок в мультимодальных рассуждениях, позволяя разработчикам генерировать и редактировать видео с помощью текстовых запросов на естественном языке. При цене $0,10 за секунду видеовыхода она является конкурентоспособной наряду с Veo 3.1 Fast.

Gemini Omni Flash превосходно справляется с «разговорным редактированием видео», когда пользователи могут уточнять клипы, используя текст, изображения или существующее видео в качестве входных данных. Хотя текущие ограничения включают максимальную длину клипа в 10 секунд и ограниченную согласованность персонажей при сложных движениях камеры, способность модели синхронизировать текст и графику с действиями на видео знаменует собой значительный шаг вперед в создании контента с помощью ИИ.

Мощь цепочек моделей и Interactions API

Истинная стратегическая ценность этого релиза заключается в синергии двух моделей. Google поощряет рабочий процесс «цепочек» (chaining): разработчики могут использовать Nano Banana 2 Lite для мгновенной генерации высококачественного референсного изображения, а затем подавать это изображение в Gemini Omni Flash для его анимации в видео.

Чтобы облегчить этот процесс, Google продвигает свой Interactions API, который служит стандартом для таких рабочих процессов. API сохраняет историю сессий и контекст, позволяя выполнять до трех последовательных правок, благодаря чему творческий процесс становится похожим на непрерывный диалог с ИИ. Чтобы продемонстрировать эти возможности, Google запустила три демонстрационных приложения: «Anywhere» для анимации путешествий, «Space Lift» для дизайна интерьеров и «Omni Product Studio» для генерации видео в электронной коммерции.

Как и все генеративные модели Google, Nano Banana 2 Lite и Gemini Omni Flash используют водяные знаки SynthID, чтобы гарантировать возможность проверки контента, созданного ИИ, на платформах Google.

Основные выводы

  • Эффективность в масштабе: Nano Banana 2 Lite выдает изображения 1K за четыре секунды всего за $0,034, оптимизируя рабочие процессы для высокопроизводительных задач.
  • Мультимодальное редактирование видео: Gemini Omni Flash внедряет генерацию и редактирование видео на естественном языке в Gemini API по цене $0,10 за секунду.
  • Интегрированный творческий конвейер: Разработчики могут объединять модели изображений и видео через Interactions API, чтобы беспрепятственно превращать статические активы в анимированный контент.