ভিডিও গেমের ডেটাকে বাস্তব জগতের AI-তে রূপান্তর করতে General Intuition সংগ্রহ করল $320M
General Intuition বিশ্বাস করছে যে ফিজিক্যাল ইন্টেলিজেন্স বা ভৌত বুদ্ধিমত্তার রহস্য লুকিয়ে আছে খেলোয়াড়দের রেকর্ড করা লক্ষ লক্ষ ঘণ্টার ভিডিও গেম ফুটেজের মধ্যে। গেমিং থেকে প্রাপ্ত উচ্চ-মানের অ্যাকশন ডেটা ব্যবহার করে, এই স্টার্টআপটি এমন এজেন্টিক মডেল (agentic models) তৈরি করতে চায় যা Fortnite-এর মতো ভার্চুয়াল পরিবেশ থেকে সরাসরি বাস্তব জগতের চারপেয়ে রোবটে (quadrupedal robots) নির্বিঘ্নে স্থানান্তরিত হতে পারে।
শুধুমাত্র ভিডিওর চেয়ে অ্যাকশন লেবেলের শক্তি বেশি
অনেক প্রতিযোগী যারা শুধুমাত্র ভিডিও পর্যবেক্ষণের মাধ্যমে AI এজেন্ট প্রশিক্ষণের চেষ্টা করে, তাদের থেকে General Intuition আলাদা। তারা তাদের পূর্বসূরি Medal থেকে প্রাপ্ত একটি নিজস্ব সুবিধা ব্যবহার করে। যেখানে বেশিরভাগ মডেল শুধুমাত্র পিক্সেল থেকে মুভমেন্ট বা নড়াচড়া বোঝার চেষ্টা করে, সেখানে General Intuition ব্যবহার করে "action labels"—অর্থাৎ গেমপ্লে ক্লিপের সাথে রেকর্ড করা সঠিক বাটন প্রেস এবং টাইমস্ট্যাম্প।
স্পেশাল-টেম্পোরাল রিজনিং (spatial-temporal reasoning) বা স্থানিক-কালিক যুক্তিবোধ বিকাশের জন্য এই পার্থক্যটি অত্যন্ত গুরুত্বপূর্ণ। একজন মানুষের ইনপুট কীভাবে একটি 3D স্পেসে নির্দিষ্ট মুভমেন্ট তৈরি করে তা সঠিকভাবে জানার মাধ্যমে মডেলটি কার্যকারণ সম্পর্ক (causality) শিখতে পারে: অর্থাৎ একটি কাজ কীভাবে পরিবেশকে প্রভাবিত করে। CEO Pim de Witte যুক্তি দেন যে, এটি মডেলটিকে "নিজে" এবং "পরিবেশ"-এর মধ্যে পার্থক্য করতে সাহায্য করে, যা বাস্তব জগতে কাজ করার জন্য যেকোনো এজেন্টের জন্য একটি মৌলিক প্রয়োজনীয়তা।
Fortnite সিমুলেশন থেকে রোবট এমবডিমেন্ট (Robot Embodiment)
কোম্পানির টেকনিক্যাল আর্কিটেকচার একটি "world model"-এর ওপর ভিত্তি করে তৈরি, যা একটি অভ্যন্তরীণ ট্রেনিং জিম হিসেবে কাজ করে। প্রথাগত গেম ইঞ্জিনের ওপর নির্ভর করার পরিবর্তে, মডেলটি ফ্রেম-বাই-ফ্রেম পরিবেশ তৈরি করে, যা এজেন্টদের বারবার অনুশীলনের মাধ্যমে পদার্থবিজ্ঞানের বাস্তবতা—যেমন দেয়ালের দৃঢ়তা বা ছায়ার নড়াচড়া—শিখতে সাহায্য করে।
এই প্রশিক্ষণের ব্যবহারিক প্রয়োগ তাদের হার্ডওয়্যার ডেমোতে ইতিমধ্যেই দেখা যাচ্ছে। কোম্পানিটি ভার্চুয়াল ল্যান্ডস্কেপ নেভিগেট করার জন্য ব্যবহৃত সেই একই "মস্তিষ্ক" একটি বড় চারপেয়ে রোবটে সফলভাবে স্থাপন করেছে। উল্লেখযোগ্যভাবে, দলটি জানিয়েছে যে রোবটের বাস্তব জগতের নেভিগেশনের জন্য মডেলটিকে ফাইন-টিউন করতে পাবলিক রাস্তায় সংগৃহীত মাত্র আট মিনিটের রিয়েল-ওয়ার্ল্ড রোবোটিক্স ডেটা প্রয়োজন হয়েছে। এটি নির্দেশ করে যে বুদ্ধিমত্তার মূল কাজগুলো সিমুলেশনে সম্পন্ন হচ্ছে, যা বাস্তব জগতে প্রয়োগের প্রক্রিয়াকে অনেক দ্রুত এবং সাশ্রয়ী করে তুলছে।
বিশাল $2.3 বিলিয়ন ডলারের ভ্যালুয়েশন
এই উচ্চাকাঙ্ক্ষার প্রতিফলন ঘটেছে কোম্পানির সাম্প্রতিক ফান্ডিংয়ে। Khosla Ventures-এর নেতৃত্বে পরিচালিত একটি রাউন্ডে General Intuition $320 million সংগ্রহ করেছে, যা এর মোট ভ্যালুয়েশনকে $2.3 billion-এ নিয়ে গেছে। এই বিনিয়োগকারী গ্রুপটি প্রযুক্তি জগতের অত্যন্ত প্রভাবশালী ব্যক্তিদের সমন্বয়ে গঠিত, যার মধ্যে রয়েছেন Jeff Bezos, Eric Schmidt এবং Google DeepMind ও MIT-এর গবেষকরা।
এই মূলধন দুটি প্রাথমিক লক্ষ্যের জন্য বরাদ্দ করা হয়েছে:
- Scaling Compute: CoreWeave-এর সাথে অংশীদারিত্বের মাধ্যমে কোম্পানিটি তাদের মডেলের পরবর্তী প্রজন্মের প্রি-ট্রেনিংয়ের ওপর গুরুত্ব দেবে।
- API Accessibility: তহবিলের একটি অংশ একটি বিস্তৃত API লঞ্চ করার জন্য ব্যবহৃত হবে, যা সম্ভবত গ্রীষ্মের শেষের দিকে ডেভেলপারদের তাদের এজেন্টিক মডেলগুলো ব্যবহারের সুযোগ করে দেবে।
ইন্ডাস্ট্রি যখন Large Language Models (LLMs)-এর টেক্সট-নির্ভর যুগ পেরিয়ে এগিয়ে যাচ্ছে, General Intuition তখন নিজেকে "world models"-এর অগ্রভাগে স্থাপন করছে—এমন এক AI যা কেবল পৃথিবী সম্পর্কে কথা বলে না, বরং এর মধ্য দিয়ে কীভাবে চলাফেরা করতে হয় তাও বোঝে।
মূল বিষয়সমূহ
- অ্যাকশন-চালিত প্রশিক্ষণ: শুধুমাত্র ভিডিওর পরিবর্তে মানুষের গেমপ্লে "action labels" ব্যবহার করার মাধ্যমে, মডেলটি ভিডিও-নির্ভর পদ্ধতির তুলনায় কার্যকারণ সম্পর্ক এবং স্পেশাল রিজনিং অনেক বেশি কার্যকরভাবে শিখতে পারে।
- স্কেলেবল সিমুলেশন: স্টার্টআপটি এজেন্টদের প্রশিক্ষিত করতে ভিডিও গেমকে একটি "gym" হিসেবে ব্যবহার করে, যা বাস্তব জগতের রোবট নিয়ন্ত্রণের জন্য প্রয়োজনীয় ব্যয়বহুল ডেটার পরিমাণ নাটকীয়ভাবে কমিয়ে দেয়।
- কৌশলগত সমর্থন: $2.3B ভ্যালুয়েশন এবং Khosla Ventures ও Jeff Bezos-এর মতো প্রভাবশালী ব্যক্তিদের সমর্থন নিয়ে কোম্পানিটি জেনারালাইজড AI এজেন্টদের জন্য একটি মৌলিক স্তর (foundational layer) হিসেবে প্রতিষ্ঠিত হওয়ার পথে রয়েছে।
