Google czyni Interactions API domyślnym sposobem budowania agentów Gemini
Google zmienia sposób budowania z Gemini.
Interactions API jest już ogólnie dostępne. Stało się ono głównym sposobem pracy z modelami i agentami Gemini.
To istotna zmiana dla programistów. Google przechodzi na podejście typu agent-first. Choć stare API generateContent wciąż działa, nowe funkcje agentów będą najpierw pojawiać się w Interactions API.
Kluczowe funkcje Interactions API:
• Jeden endpoint do wszystkiego. Użyj ID modelu do prostych zadań lub ID agenta do zadań długotrwałych.
• Managed Agents. Jedno wywołanie API konfiguruje piaskownicę (sandbox) Linux. Agent może uruchamiać kod, przeglądać sieć i zarządzać plikami.
• Zadania w tle. Ustaw background=True, aby uruchamiać długotrwałe zadania bez oczekiwania.
• Łączenie narzędzi. Połącz Google Search i Google Maps z własnymi funkcjami w jednym zapytaniu.
• Deep Research. Uzyskaj większą szybkość i głębię dzięki natywnym wykresom oraz multimodalnemu wsparciu dla obrazów i plików PDF.
• Generowanie mediów. Uzyskaj dostęp do narzędzi do generowania obrazów, muzyki i syntezy mowy (text-to-speech).
• Kontrola kosztów. Korzystaj z poziomów Flex lub Priority. Poziom Flex oferuje o 50% niższe koszty.
• Zachowanie stanu. Płatni użytkownicy mogą uzyskać dostęp do poprzednich interakcji przez 55 dni.
Architektura również ulega zmianie. Google odchodzi od starych formatów wiadomości. Każdy krok jest teraz typizowaną akcją, taką jak wejście użytkownika, myśl lub wywołanie funkcji.
Co powinieneś zrobić?
Jeśli zaczynasz nowy projekt Gemini, użyj Interactions API.
Jeśli masz istniejącą aplikację, pozwól jej działać dalej. Przejrzyj jednak swoje przepływy pracy (workflows). Sprawdź, czy potrzebujesz wykonywania zadań w tle lub Managed Agents.
Sprawdź swoje SDK. Google wspiera partnerów takich jak LiteLLM, Eigent i Agno.
Monitoruj koszty. Przetestuj poziom Flex dla obciążeń, gdzie szybkość jest mniej istotna niż cena.
Pamiętaj, że Managed Agents działają po stronie Google. Jeśli operujesz na wrażliwych danych, sprawdź zachowanie piaskownicy oraz mechanizmy kontroli danych.
Google nie wyłącza starego API. Pokazuje Wam przyszłość. Jeśli będziesz budować w starym modelu, możesz przegapić najlepsze nowe funkcje.
Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi
