Google, Nano Banana 2 Lite 및 Gemini Omni Flash API 출시

Google이 지연 시간을 대폭 줄이고 영화 같은 창의성을 구현하도록 설계된 두 가지 강력한 신규 모델을 출시하며 생성형 AI 생태계를 확장했습니다. 고속 이미지 생성을 위한 Nano Banana 2 Lite와 비디오 합성을 위한 Gemini Omni Flash를 도입함으로써, Google은 개발자들이 정적인 개념에서 움직이는 미디어로 전환할 수 있는 간소화된 파이프라인을 제공합니다.

Nano Banana 2 Lite: 고처리량 이미지 생성

Google은 Nano Banana 2 Lite(API 상의 기술적 명칭은 gemini-3.1-flash-lite-image)를 출시하며 속도와 비용 효율성을 원하는 개발자들의 수요를 공략하고 있습니다. 이 모델은 신속한 아이디어 구상과 대량 생산 파이프라인을 위해 특수 제작되었으며, 단 4초 만에 1K 해상도의 이미지를 생성할 수 있습니다.

이미지당 0.034달러의 가격으로, Nano Banana 2 Lite는 대규모 이미지 생성 워크플로우를 운영하는 기업에 상당한 경제적 이점을 제공합니다. 최적화된 속도에도 불구하고, Google은 이 모델이 프롬프트 준수, 캐릭터 일관성 및 텍스트 가독성 면에서 높은 수준을 유지한다고 주장합니다. 이 모델은 다음과 같은 3단계 계층 구조를 완성합니다:

  • Nano Banana 2 Lite: 극도의 속도와 저비용에 집중.
  • Nano Banana 2 (Gemini 3.1 Flash Image): 다재다능한 "올라운더(all-rounder)".
  • Nano Banana Pro (Gemini 3.1 Pro Image): 전문가급 추론 및 복잡한 제어를 위해 설계됨.

이 모델은 개발자만을 위한 것이 아닙니다. Google Search(AI 모드), NotebookLM, Google Photos, Google Ads를 포함한 Google 생태계 전반에 통합되고 있습니다.

Gemini Omni Flash: API로 비디오 기능 구현

Google I/O에서의 프리뷰에 이어, Gemini Omni Flash를 이제 Gemini API와 Google AI Studio를 통해 공식적으로 사용할 수 있습니다. 이 모델은 멀티모달 추론의 도약을 의미하며, 개발자가 자연어 프롬프트를 사용하여 비디오를 생성하고 편집할 수 있도록 합니다. 비디오 출력 초당 0.10달러로 책정된 이 모델은 Veo 3.1 Fast와 경쟁할 만한 가격대를 형성하고 있습니다.

Gemini Omni Flash는 사용자가 텍스트, 이미지 또는 기존 비디오를 입력값으로 사용하여 클립을 다듬을 수 있는 "대화형 비디오 편집(conversational video editing)"에 탁월합니다. 현재 최대 클립 길이가 10초로 제한되어 있고 복잡한 카메라 움직임 시 캐릭터 일관성이 제한적이라는 한계가 있지만, 텍스트와 그래픽을 비디오 동작과 동기화하는 모델의 능력은 AI 기반 콘텐츠 제작의 중요한 진전을 의미합니다.

모델 체이닝(Model Chaining)과 Interactions API의 힘

이번 출시의 진정한 전략적 가치는 두 모델 사이의 시너지에 있습니다. Google은 "체이닝(chaining)" 워크플로우를 권장하고 있습니다. 즉, 개발자가 Nano Banana 2 Lite를 사용하여 고품질 참조 이미지를 즉시 생성한 다음, 해당 이미지를 Gemini Omni Flash에 입력하여 비디오로 애니메이션화할 수 있습니다.

이를 용이하게 하기 위해 Google은 이러한 워크플로우의 기본이 되는 Interactions API를 홍보하고 있습니다. 이 API는 세션 기록과 문맥을 유지하여 최대 3회의 연속 편집을 가능하게 함으로써, 창작 과정이 AI와의 지속적인 대화처럼 느껴지도록 합니다. 이러한 기능을 입증하기 위해 Google은 여행 애니메이션을 위한 "Anywhere", 인테리어 디자인을 위한 "Space Lift", 이커머스 비디오 생성을 위한 "Omni Product Studio" 등 세 가지 데모 앱을 출시했습니다.

모든 Google 생성형 모델과 마찬가지로, Nano Banana 2 Lite와 Gemini Omni Flash 모두 SynthID 워터마킹을 활용하여 Google 플랫폼 전반에서 AI 생성 콘텐츠를 검증할 수 있도록 합니다.

핵심 요약

  • 규모의 효율성: Nano Banana 2 Lite는 단 0.034달러로 4초 만에 1K 이미지를 제공하여 고처리량이 필요한 워크플로우를 최적화합니다.
  • 멀티모달 비디오 편집: Gemini Omni Flash는 초당 0.10달러의 가격으로 Gemini API에 자연어 비디오 생성 및 편집 기능을 도입합니다.
  • 통합된 크리에이티브 파이프라인: 개발자는 Interactions API를 통해 이미지와 비디오 모델을 체이닝하여 정적 에셋을 애니메이션 콘텐츠로 원활하게 변환할 수 있습니다.