Google משיקה את Nano Banana 2 Lite ואת ה-Gemini Omni Flash API
Google הרחיבה את המערכת האקולוגית של ה-AI הגנרטיבי שלה עם השקת שני מודלים עוצמתיים חדשים שנועדו לצמצם את השיהוי (latency) ולפתוח אפשרויות ליצירתיות קולנועית. באמצעות הצגת Nano Banana 2 Lite ליצירת תמונות במהירות גבוהה ו-Gemini Omni Flash לסינתזת וידאו, Google מספקת למפתחים תהליך עבודה (pipeline) יעיל למעבר ממושגים סטטיים למדיה בתנועה.
Nano Banana 2 Lite: יצירת תמונות בנפח גבוה (High-Throughput)
Google מכוונת לביקוש של מפתחים למהירות ויעילות כלכלית עם השקת Nano Banana 2 Lite (המזוהה טכנית ב-API כ-gemini-3.1-flash-lite-image). מודל זה נבנה במיוחד עבור תהליכי גיבוש רעיונות מהירים וקווי ייצור בנפח גבוה, והוא מסוגל ליצור תמונות ברזולוציית 1K תוך ארבע שניות בלבד.
במחיר של $0.034 לתמונה, Nano Banana 2 Lite מציע יתרון כלכלי משמעותי לחברות המריצות תהליכי עבודה מאסיביים של יצירת תמונות. למרות המהירות האופטימלית שלו, Google טוענת כי המודל שומר על סטנדרטים גבוהים של עמידה בהנחיות (prompt following), עקביות דמויות וקריאות טקסט. מודל זה משלים היררכיה בת שלושה שלבים:
- Nano Banana 2 Lite: מתמקד במהירות קיצונית ובעלות נמוכה.
- Nano Banana 2 (Gemini 3.1 Flash Image): ה-"all-rounder" הרב-תכליתי.
- Nano Banana Pro (Gemini 3.1 Pro Image): מתוכנן לחשיבה (reasoning) ברמה מקצועית ולשליטה מורכבת.
המודל אינו מיועד רק למפתחים; הוא מוטמע בכל המערכת האקולוגית של Google, כולל Google Search (AI Mode), NotebookLM, Google Photos ו-Google Ads.
Gemini Omni Flash: מביא את הווידאו ל-API
לאחר התצוגה המקדימה ב-Google I/O, Gemini Omni Flash זמין כעת באופן רשמי דרך ה-Gemini API ו-Google AI Studio. מודל זה מייצג קפיצת מדרגה בחשיבה מולטי-מודאלית (multimodal reasoning), המאפשרת למפתחים ליצור ולערוך וידאו באמצעות הנחיות בשפה טבעית. במחיר של $0.10 לכל שנייה של וידאו, הוא מתחרה ישירות ב-Veo 3.1 Fast.
Gemini Omni Flash מצטיין ב-"עריכת וידאו שיחתית" (conversational video editing), שבה משתמשים יכולים לשפר קליפים באמצעות טקסט, תמונות או וידאו קיים כקלט. בעוד שהמגבלות הנוכחיות כוללות אורך קליפ מקסימלי של 10 שניות ועקביות דמויות מוגבלת בתנועות מצלמה מורכבות, יכולתו של המודל לסנכרן טקסט וגרפיקה עם פעולות הווידאו מהווה צעד משמעותי קדימה ביצירת תוכן מונעת AI.
העוצמה של שרשור מודלים (Model Chaining) וה-Interactions API
הערך האסטרטגי האמיתי של השקה זו טמון בסינרגיה בין שני המודלים. Google מעודדת תהליך עבודה של "שרשור" (chaining): מפתחים יכולים להשתמש ב-Nano Banana 2 Lite כדי ליצור באופן מיידי תמונת ייחוס באיכות גבוהה, ולאחר מכן להזין את התמונה לתוך Gemini Omni Flash כדי להנפיש אותה לווידאו.
כדי להקל על כך, Google מקדמת את ה-Interactions API שלה, המשמש כברירת מחדל עבור תהליכי עבודה אלו. ה-API שומר על היסטוריית הסשן וההקשר (context), ומאפשר עד שלושה עריכות רצופות, מה שגורם לתהליך היצירתי להרגיש יותר כמו דיאלוג רציף עם ה-AI. כדי להדגים את היכולות הללו, Google השיקה שלוש אפליקציות דמו: "Anywhere" לאנימציית טיולים, "Space Lift" לעיצוב פנים, ו-"Omni Product Studio" ליצירת סרטוני אי-קומרס.
בדומה לכל המודלים הגנרטיביים של Google, הן Nano Banana 2 Lite והן Gemini Omni Flash משתמשים בסימון מים (watermarking) מסוג SynthID כדי להבטיח שניתן יהיה לאמת תוכן שנוצר על ידי AI בפלטפורמות של Google.
נקודות מרכזיות
- יעילות בקנה מידה גדול: Nano Banana 2 Lite מספק תמונות 1K תוך ארבע שניות תמורת $0.034 בלבד, מה שמשפר תהליכי עבודה עבור צרכים בנפח גבוה.
- עריכת וידאו מולטי-מודאלית: Gemini Omni Flash מציג יצירה ועריכה של וידאו בשפה טבעית בתוך ה-Gemini API במחיר של $0.10 לשנייה.
- תהליך יצירה משולב: מפתחים יכולים לשרשר מודלים של תמונה ווידאו באמצעות ה-Interactions API כדי להפוך נכסים סטטיים לתוכן מונפש בצורה חלקה.
