Google、Nano Banana 2 LiteとGemini Omni Flash APIを発表

Googleは、レイテンシを大幅に削減し、映画のような創造性を解き放つために設計された2つの強力な新モデルをリリースし、生成AIエコシステムを拡張しました。高速な画像生成のためのNano Banana 2 Liteと、動画合成のためのGemini Omni Flashを導入することで、Googleは開発者が静止したコンセプトから動的なメディアへと移行するための合理化されたパイプラインを提供しています。

Nano Banana 2 Lite:高スループットな画像生成

Googleは、Nano Banana 2 Lite(API上では技術的にgemini-3.1-flash-lite-imageとして識別)のリリースにより、開発者のスピードとコスト効率に対する需要に応えています。このモデルは、迅速なアイデア出しと大量生産のパイプライン向けに特化して構築されており、わずか4秒で1K解像度の画像を生成することが可能です。

画像1枚あたり0.034ドルという価格設定により、Nano Banana 2 Liteは、大規模な画像生成ワークフローを実行する企業に大きな経済的メリットをもたらします。最適化されたスピードにもかかわらず、Googleはこのモデルがプロンプトへの追従性、キャラクターの一貫性、およびテキストの読みやすさにおいて高い基準を維持していると主張しています。このモデルにより、以下の3段階の階層が完成します。

  • Nano Banana 2 Lite: 極限のスピードと低コストに特化。
  • Nano Banana 2 (Gemini 3.1 Flash Image): 多才な「オールラウンダー」。
  • Nano Banana Pro (Gemini 3.1 Pro Image): プロフェッショナル級の推論と複雑な制御向けに設計。

このモデルは開発者だけでなく、Google Search (AI Mode)、NotebookLM、Google Photos、Google Adsを含むGoogleのエコシステム全体に統合されています。

Gemini Omni Flash:APIに動画機能をもたらす

Google I/Oでのプレビューに続き、Gemini Omni FlashがGemini APIおよびGoogle AI Studioを通じて正式に利用可能になりました。このモデルはマルチモーダル推論における飛躍を象徴しており、開発者は自然言語のプロンプトを使用して動画を生成および編集できます。動画出力1秒あたり0.10ドルという価格設定で、Veo 3.1 Fastと競争力のある位置にあります。

Gemini Omni Flashは、テキスト、画像、または既存の動画を入力として使用してクリップを微調整できる「対話型動画編集」に優れています。現在の制限として、最大クリップ長が10秒であることや、複雑なカメラワークにおけるキャラクターの一貫性が限定的であることなどが挙げられますが、テキストやグラフィックを動画の動きと同期させるモデルの能力は、AI主導のコンテンツ制作における重要な一歩となります。

モデルチェイニングの力とInteractions API

今回のリリースの真の戦略的価値は、2つのモデル間のシナジーにあります。Googleは「チェイニング(連鎖)」ワークフローを推奨しています。開発者はNano Banana 2 Liteを使用して高品質なリファレンス画像を即座に生成し、その画像をGemini Omni Flashに投入して動画としてアニメーション化することができます。

これを促進するために、Googleはこれらのワークフローのデフォルトとして機能するInteractions APIを推進しています。このAPIはセッション履歴とコンテキストを保持し、最大3回までの連続した編集を可能にするため、クリエイティブなプロセスがAIとの継続的な対話であるかのように感じられます。これらの機能を実証するために、Googleは3つのデモアプリをリリースしました。旅行アニメーション用の「Anywhere」、インテリアデザイン用の「Space Lift」、そしてeコマース動画生成用の「Omni Product Studio」です。

すべてのGoogle生成モデルと同様に、Nano Banana 2 LiteとGemini Omni Flashの両方がSynthIDウォーターマーキングを利用しており、AI生成コンテンツがGoogleのプラットフォーム全体で検証可能であることを保証しています。

主なポイント

  • 大規模な効率性: Nano Banana 2 Liteは、わずか0.034ドルで1K画像を4秒で提供し、高スループットなニーズに合わせてワークフローを最適化します。
  • マルチモーダル動画編集: Gemini Omni Flashは、1秒あたり0.10ドルで、自然言語による動画生成と編集をGemini APIに導入します。
  • 統合されたクリエイティブ・パイプライン: 開発者はInteractions APIを介して画像モデルと動画モデルをチェインさせ、静止資産をシームレスにアニメーションコンテンツに変換できます。