کس طرح General Intuition حقیقی دنیا کے AI کی تعمیر کے لیے ویڈیو گیمز کا استعمال کر رہا ہے
General Intuition جسمانی دنیا کے لیے ایجنٹک ماڈلز (agentic models) کی تربیت کے لیے ویڈیو گیمز کے وسیع ڈیٹا سیٹس کا استعمال کرتے ہوئے روبوٹکس میں ایک بڑی تبدیلی (paradigm shift) لانے کی کوشش کر رہا ہے۔ $320 ملین کے نئے فنڈنگ راؤنڈ کے ساتھ، یہ اسٹارٹ اپ اس بات پر شرط لگا رہا ہے کہ گیمنگ میں پایا جانے والا "ایکشن ڈیٹا" مصنوعی ذہانت (AI) کے لیے وہ گمشدہ کڑی ہے جس کی ضرورت ہے۔
ایکشن لیبلز اور اسپیشل-ٹیمپورل ریژوننگ (Spatial-Temporal Reasoning) کی طاقت
اگرچہ بہت سے AI محققین محض ویڈیو فوٹیج کے مشاہدے سے ماڈلز کو تربیت دینے کی کوشش کرتے ہیں، لیکن General Intuition کے CEO Pim de Witte کا کہنا ہے کہ صرف ویڈیو کافی نہیں ہے۔ کمپنی کا مقابلہ کرنے والا فائدہ Medal سے حاصل کردہ ملکیتی ڈیٹا تک رسائی میں پنہاں ہے، جو کہ ایک ایسا پلیٹ فارم ہے جہاں صارفین ویڈیو گیم کلپس شیئر کرتے ہیں۔
عام ویڈیوز کے برعکس، ان کلپس میں "ایکشن لیبلز" شامل ہوتے ہیں—یعنی اس کا درست ریکارڈ کہ کھلاڑی نے کون سے بٹن دبائے اور بالکل کب۔ یہ ماڈل کو محض پیٹرن کی شناخت سے آگے بڑھنے کی اجازت دیتا ہے؛ یہ اسپیشل-ٹیمپورل ریژوننگ سیکھتا ہے۔ ایک مخصوص ان پٹ (ایک ایکشن) اور ماحول میں ہونے والی تبدیلی (ردعمل) کے درمیان براہ راست تعلق کو سمجھ کر، AI وجہ اور اثر (causality) کو سمجھنا شروع کر دیتا ہے۔ یہ ماڈل کو "خود" اور "ماحول" کے درمیان فرق کرنے کے قابل بناتا ہے، جو کہ کسی بھی خود مختار ایجنٹ (autonomous agent) کے لیے ایک بنیادی ضرورت ہے۔
Fortnite سے لے کر کوڈروپیڈ (Quadruped) روبوٹس تک
کمپنی کا تکنیکی مقصد ایک ایسا واحد ماڈل بنانا ہے جو مختلف شعبوں: گیم پلے، سیمولیشن، اور جسمانی وجود (physical embodiment) میں کام کر سکے۔ حالیہ مظاہرے میں، گیم پلے پر تربیت یافتہ ایک AI ایجنٹ پیچیدہ ورچوئل ماحول میں راستہ تلاش کرنے میں کامیاب رہا، اور یہ سمجھ سکا کہ دیواریں ٹھوس اشیاء ہیں اور سائے سورج کی حرکت کے ساتھ بدلتے ہیں۔
اہم بات یہ ہے کہ اس "دماغ" کو براہ راست ہارڈ ویئر پر منتقل کیا جا رہا ہے۔ کمپنی نے ایک کوڈروپیڈل (چار ٹانگوں والا) روبوٹ دکھایا جس نے اسی ماڈل کا استعمال کیا جو اس کے گیمنگ ایجنٹس کو چلا رہا تھا۔ خاص طور پر، ٹیم نے بتایا کہ روبوٹ کی نیویگیشن کے لیے ماڈل کو فائن ٹیون کرنے کے لیے حقیقی سڑکوں سے جمع کردہ صرف آٹھ منٹ کے حقیقی دنیا کے روبوٹکس ڈیٹا کی ضرورت پڑی۔ اس سے پتہ چلتا ہے کہ فزکس اور مکانی آگاہی (spatial awareness) سیکھنے کا بڑا کام ویڈیو گیمز کے "جم" میں ہو رہا ہے، جس سے حقیقی دنیا میں اس کا استعمال نمایساً زیادہ موثر ہو جاتا ہے۔
جنرل ایجنٹس پر $2.3 بلین کی شرط
اس عزیمت کا پیمانہ کمپنی کی ویلیویشن (valuation) میں نظر آتا ہے۔ General Intuition نے حال ہی میں $2.3 بلین کی ویلیویشن پر $320 ملین جمع کیے ہیں، جس سے اس کی کل ظاہر کردہ فنڈنگ $454 ملین ہو گئی ہے۔ اس راؤنڈ کی قیادت Khosla Ventures نے کی، جس میں General Catalyst، Jeff Bezos، Eric Schmidt، اور Google DeepMind اور MIT کے محققین نے نمایاں حصہ لیا۔
یہ سرمایہ دو بنیادی مقاصد کے لیے مختص کیا گیا ہے: CoreWeave کے ساتھ شراکت داری کے ذریعے کمپیوٹ کی صلاحیت کو بڑھانا اور موسم گرما کے اختتام تک اپنی API کو زیادہ وسیع پیمانے پر دستیاب بنانا۔ Vinod Khosla جیسے سرمایہ کاروں کے لیے، مقصد صرف بہتر آٹومیشن نہیں ہے، بلکہ "AI intuition" کا ظہور ہے—یعنی محض پروگرام شدہ ہدایات پر عمل کرنے کے بجائے، سمجھ بوجھ کے ذریعے دنیا میں راستہ تلاش کرنے کی انسانی جیسی صلاحیت۔
اہم نکات
- ایکشن پر مبنی تربیت: General Intuition گیمنگ کلپس سے بٹن دبانے کے "ایکشن لیبلز" کا استعمال کرتے ہوئے AI کو وجہ اور اثر (causality) سکھاتا ہے، جو صرف ویڈیو پر مبنی تربیت کی حدود سے آگے بڑھتا ہے۔
- قابل توسیع سیمولیشن: ویڈیو گیمز کو "جم" کے طور پر استعمال کرتے ہوئے، کمپنی حقیقی دنیا کے روبوٹک ڈیٹا کو جمع کرنے کے بھاری اخراجات کے بغیر پیچیدہ اسپیشل-ٹیمپورل ریژوننگ کی تربیت دے سکتی ہے۔
- بڑے پیمانے پر ادارہ جاتی تعاون: $2.3 بلین کی ویلیویشن اور Jeff Bezos اور Eric Schmidt جیسی شخصیات کی حمایت کے ساتھ، کمپنی خود کو "ورلڈ ماڈل" کے دور میں ایک بنیادی کھلاڑی کے طور پر پیش کر رہی ہے۔
