Sakana AI Launches Fugu to Orchestrate Multi LLM Intelligence

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial৪ ঘন্টা আগে3min read

In this article

Sakana AI মাল্টি-LLM ইন্টেলিজেন্স পরিচালনা করার জন্য Fugu লঞ্চ করেছে

টোকিও-ভিত্তিক Sakana AI Fugu উন্মোচন করেছে, যা একটি উন্নত মাল্টি-LLM অর্কেস্ট্রেটর (orchestrator) হিসেবে ডিজাইন করা হয়েছে। এটি জটিল কাজ সমাধানের জন্য বিশেষায়িত মডেলের একটি পুল পরিচালনা করতে পারে। একটি একক বুদ্ধিমান স্তর হিসেবে কাজ করার মাধ্যমে, Fugu Anthropic-এর মতো শিল্প নেতাদের পারফরম্যান্সের সাথে পাল্লা দেওয়ার লক্ষ্য রাখে এবং একই সাথে ভেন্ডর লক-ইন (vendor lock-in) থেকে বাঁচার একটি কৌশলগত সুরক্ষা প্রদান করে।

একটি পরিবর্তনযোগ্য এজেন্ট পুলের জন্য একটি ইউনিফাইড ইন্টারফেস

Fugu কেবল একটি সাধারণ স্ট্যান্ডঅ্যালোন লার্জ ল্যাঙ্গুয়েজ মডেল নয়; এটি বিশেষভাবে একটি "এজেন্ট পুল" পরিচালনা করার জন্য প্রশিক্ষিত একটি ল্যাঙ্গুয়েজ মডেল। প্রান্তিক ব্যবহারকারীর কাছে, সিস্টেমটি একটি OpenAI-সামঞ্জস্যপূর্ণ API-এর মাধ্যমে একটি একক সত্তা হিসেবে কাজ করে। তবে অভ্যন্তরীণভাবে, Fugu নির্বাচন, ডেলিগেশন, এক্সিকিউশন, চেকিং এবং সিন্থেসিসের একটি জটিল চক্র সম্পন্ন করে। প্রম্পটের জটিলতার ওপর ভিত্তি করে, Fugu একা সমস্যাটি সমাধান করতে পারে অথবা কাজের চাপ সামলাতে নিজেকেসহ বিশেষায়িত মডেলের একটি "টিম" বা দল গঠন করতে পারে।

বিভিন্ন পেশাদার প্রয়োজন মেটাতে Sakana AI দুটি ভিন্ন সংস্করণ অফার করছে:

Fugu Base: লো ল্যাটেন্সি (low latency) এবং চ্যাটবট ইন্টারঅ্যাকশন ও স্ট্যান্ডার্ড কোড রিভিউয়ের মতো দৈনন্দিন কাজের জন্য অপ্টিমাইজ করা হয়েছে।
Fugu Ultra: সর্বোচ্চ রিজনিং কোয়ালিটির জন্য তৈরি করা হয়েছে, যা বৈজ্ঞানিক গবেষণাপত্র পুনরুৎপাদন, সাইবার সিকিউরিটি অ্যানালাইসিস এবং পেটেন্ট অনুসন্ধানের মতো উচ্চ-ঝুঁকিপূর্ণ ওয়ার্কফ্লোগুলোকে লক্ষ্য করে তৈরি।

বেঞ্চমার্কে ফ্রন্টিয়ার মডেলগুলোকে ছাড়িয়ে যাওয়া

Fugu Ultra-এর পারফরম্যান্স মেট্রিক্স অত্যন্ত চমকপ্রদ, যা এটিকে Anthropic-এর বহুল প্রতীক্ষিত Fable 5 এবং Mythos Preview-এর সাথে সরাসরি প্রতিযোগিতায় দাঁড় করিয়েছে। উল্লেখযোগ্যভাবে, Fugu Ultra এই স্কোরগুলো এমন একটি পুল ব্যবহার করে অর্জন করেছে যার মধ্যে Anthropic-এর মডেলগুলো অন্তর্ভুক্ত নেই, যা ইঙ্গিত দেয় যে সেই এজেন্টগুলো যুক্ত করা হলে এর সক্ষমতা আরও অনেক বৃদ্ধি পেতে পারে।

কঠোর পরীক্ষার মাধ্যমে, Fugu Ultra বেশ কিছু গুরুত্বপূর্ণ টেকনিক্যাল বেঞ্চমার্কে উন্নত সক্ষমতা প্রদর্শন করেছে:

SWE Bench Pro: Fugu Ultra স্কোর করেছে 73.7, যা GPT 5.5 (58.6) এবং Gemini 3.1 Pro (54.2)-কে উল্লেখযোগ্যভাবে ছাড়িয়ে গেছে।
LiveCodeBench: Fugu Ultra 93.2 স্কোর অর্জন করেছে, যা Opus 4.8 (87.8) এবং GPT 5.5 (85.3)-কে অতিক্রম করেছে।
Humanity's Last Exam: মডেলটি 50.0 স্কোর অর্জন করেছে, যা Opus 4.8 (49.8)-এর চেয়ে সামান্য বেশি।
GPQA-D: Fugu Ultra 95.5-এর উচ্চ মান স্পর্শ করেছে।

প্রাথমিক বিটা পরীক্ষকরা বিশেষায়িত ক্ষেত্রগুলোতে ব্যাপক দক্ষতা বৃদ্ধির কথা জানিয়েছেন। একজন ডেভেলপার উল্লেখ করেছেন যে, কোড রিভিউ করার সময় Fugu Ultra ২০টিরও বেশি বাগ (bug) শনাক্ত করেছে, যেখানে GPT-5.5 মাত্র প্রায় তিনটি চিহ্নিত করতে পেরেছিল।

AI ভেন্ডর লক-ইন-এর ঝুঁকি কমানো

শুধুমাত্র পারফরম্যান্সের বাইরেও, Sakana AI Fugu-কে ডিজিটাল সার্বভৌমত্বের (digital sovereignty) একটি গুরুত্বপূর্ণ হাতিয়ার হিসেবে উপস্থাপন করছে। এমন এক যুগে যেখানে রপ্তানি নিয়ন্ত্রণ এবং নিয়ন্ত্রক পরিবর্তনগুলো হঠাৎ করে নির্দিষ্ট মডেলের অ্যাক্সেস সীমিত করে দিতে পারে (যেমন Anthropic-এর সাম্প্রতিক বিধিনিষেধ), সেখানে একটি একক প্রোভাইডারের ওপর নির্ভর করা অর্থায়ন, শাসনব্যবস্থা এবং গুরুত্বপূর্ণ অবকাঠামোর জন্য একটি বড় ঝুঁকি বা দুর্বলতা তৈরি করে।

যেহেতু Fugu একটি পরিবর্তনযোগ্য (swappable) এজেন্ট পুল ব্যবহার করে, তাই কোনো একটি API কাজ করা বন্ধ করে দিলে সংস্থাগুলো তাদের ওয়ার্কফ্লো অন্য প্রোভাইডারের কাছে ঘুরিয়ে নিতে পারে। যদিও এটি "AI সার্বভৌমত্বের" জন্য সম্পূর্ণ সমাধান নয়—কারণ শিল্পজুড়ে ব্যাপক বিধিনিষেধ এখনও পুলটিকে সীমিত করতে পারে—তবে এটি সেইসব এন্টারপ্রাইজের জন্য সহনশীলতার একটি গুরুত্বপূর্ণ স্তর প্রদান করে যারা তাদের AI নির্ভরতা বহুমুখী করতে চায়।

মূল বিষয়সমূহ

ডায়নামিক অর্কেস্ট্রেশন: Fugu একটি একক API হিসেবে কাজ করে যা অভ্যন্তরীণভাবে জটিল ও বহু-ধাপের সমস্যা সমাধানের জন্য বিশেষায়িত মডেলের একটি দল পরিচালনা করে।
বেঞ্চমার্কে আধিপত্য: Fugu Ultra সরাসরি Anthropic-এর Fable 5 এবং Mythos-এর সাথে প্রতিযোগিতা করে এবং কোডিং (SWE Bench Pro) ও রিজনিং বেঞ্চমার্কে উল্লেখযোগ্য ব্যবধান দেখায়।
কৌশলগত সহনশীলতা: পরিবর্তনযোগ্য মডেল পুল ব্যবহারকারীদের AI প্রোভাইডার বহুমুখী করার মাধ্যমে ভেন্ডর লক-ইন এবং নিয়ন্ত্রক বিঘ্নের ঝুঁকি কমাতে সাহায্য করে।

Sakana AI Launches Fugu to Orchestrate Multi LLM Intelligence

Sakana AI মাল্টি-LLM ইন্টেলিজেন্স পরিচালনা করার জন্য Fugu লঞ্চ করেছে

একটি পরিবর্তনযোগ্য এজেন্ট পুলের জন্য একটি ইউনিফাইড ইন্টারফেস

বেঞ্চমার্কে ফ্রন্টিয়ার মডেলগুলোকে ছাড়িয়ে যাওয়া

AI ভেন্ডর লক-ইন-এর ঝুঁকি কমানো

মূল বিষয়সমূহ

Continue reading

Zhipu AI-এর GLM 5.2 ক্লোজড সোর্স কোডিং জায়ান্টদের সাথে ব্যবধান কমিয়ে আনছে

এআই ওয়ার্কফ্লো, ই-কমার্স এবং এজেন্ট অর্কেস্ট্রেশন

e2e assure লঞ্চ করেছে Cumulo: IT এবং OT-এর জন্য একটি সভরেন AI চালিত SOC

Salesforce এবং ServiceNow স্বায়ত্তশাসিত এজেন্ট লঞ্চ করেছে

মাল্টি এজেন্ট এআই সিস্টেম: একটি ব্যবহারিক গাইড