Sakana AI wprowadza Fugu, aby orkiestrować inteligencję opartą na wielu modelach LLM
Z siedzibą w Tokio firma Sakana AI zaprezentowała Fugu – zaawansowany orkiestrator multi-LLM, zaprojektowany do koordynowania puli wyspecjalizowanych modeli w celu rozwiązywania złożonych zadań. Działając jako pojedyncza inteligentna warstwa, Fugu ma konkurować wydajnością z liderami branży, takimi jak Anthropic, oferując jednocześnie strategiczne zabezpieczenie przed uzależnieniem od jednego dostawcy (vendor lock-in).
Jednolity interfejs dla wymienialnej puli agentów
Fugu to nie jest kolejny samodzielny duży model językowy; to model językowy wyspecjalizowany w zarządzaniu „pulą agentów”. Dla użytkownika końcowego system działa jako pojedyncza jednostka poprzez API kompatybilne z OpenAI. Wewnątrz jednak Fugu przeprowadza złożony cykl wyboru, delegowania, wykonywania, sprawdzania i syntezy. W zależności od złożoności zapytania (promptu), Fugu może rozwiązać problem samodzielnie lub dynamicznie zwerbować „zespół” wyspecjalizowanych modeli – w tym własne kopie – aby poradzić sobie z obciążeniem.
Sakana AI oferuje dwie odrębne wersje, aby sprostać różnym potrzebom profesjonalnym:
- Fugu Base: Zoptymalizowany pod kątem niskich opóźnień i codziennych zadań, takich jak interakcje z chatbotami i standardowe przeglądy kodu.
- Fugu Ultra: Zaprojektowany z myślą o maksymalnej jakości rozumowania, skierowany do procesów o wysokim znaczeniu, takich jak reprodukcja prac naukowych, analiza cyberbezpieczeństwa i wyszukiwanie patentów.
Przewyższanie modeli typu frontier w benchmarkach
Wyniki wydajności Fugu Ultra są uderzające, stawiając go w bezpośredniej konkurencji z wyczekiwanymi modelami Fable 5 i Mythos Preview od Anthropic. Co istotne, Fugu Ultra osiąga te wyniki przy użyciu puli, która nie obejmuje modeli Anthropic, co sugeruje jeszcze wyższy potencjał w przypadku ich integracji.
W rygorystycznych testach Fugu Ultra wykazał wybitne możliwości w kilku kluczowych benchmarkach technicznych:
- SWE Bench Pro: Fugu Ultra uzyskał wynik 73,7, znacząco przewyższając GPT 5.5 (58,6) oraz Gemini 3.1 Pro (54,2).
- LiveCodeBench: Fugu Ultra osiągnął 93,2, wyprzedzając Opus 4.8 (87,8) i GPT 5.5 (85,3).
- Humanity's Last Exam: Model uzyskał wynik 50,0, wyprzedzając Opus 4.8 (49,8).
- GPQA-D: Fugu Ultra dorównał wysokiemu standardowi wynoszącemu 95,5.
Pierwsi testerzy wersji beta zgłaszają ogromne wzrosty wydajności w specjalistycznych dziedzinach. Jeden z programistów zauważył, że podczas przeglądu kodu Fugu Ultra zidentyfikował ponad 20 błędów, podczas gdy GPT-5.5 wskazał jedynie około trzech.
Łagodzenie ryzyka uzależnienia od dostawców AI
Poza samą wydajnością, Sakana AI pozycjonuje Fugu jako kluczowe narzędzie dla suwerenności cyfrowej. W erze, w której kontrole eksportowe i zmiany regulacyjne mogą nagle ograniczyć dostęp do konkretnych modeli (jak niedawne ograniczenia Anthropic), poleganie na jednym dostawcy stanowi istotną słabość dla sektora finansowego, administracji i infrastruktury krytycznej.
Dzięki temu, że Fugu wykorzystuje wymienialną pulę agentów, organizacje mogą przekierować swoje procesy do innych dostawców, jeśli jedno API przestanie działać. Choć nie jest to rozwiązanie całkowicie zapewniające „suwerenność AI” – ponieważ powszechne ograniczenia w całej branży wciąż mogłyby ograniczyć pulę modeli – stanowi ono niezbędną warstwę odporności dla przedsiębiorstw dążących do dywersyfikacji swoich zależności od AI.
Kluczowe wnioski
- Dynamiczna orkiestracja: Fugu działa jako pojedyncze API, które wewnętrznie zarządza zespołem wyspecjalizowanych modeli w celu rozwiązywania wieloetapowych, złożonych problemów.
- Dominacja w benchmarkach: Fugu Ultra bezpośrednio konkuruje z modelami Fable 5 i Mythos od Anthropic, wykazując znaczną przewagę w benchmarkach programistycznych (SWE Bench Pro) oraz rozumowania.
- Strategiczna odporność: Wymienialna pula modeli pozwala użytkownikom łagodzić ryzyko uzależnienia od dostawców oraz zakłóceń regulacyjnych poprzez dywersyfikację dostawców AI.