Probably نے پریسیژن انجینئرنگ کے ذریعے LLM Hallucinations کا مقابلہ کرنے کے لیے $9 ملین جمع کیے

جیسے جیسے Large Language Models (LLMs) پیشہ ورانہ کاموں (workflows) میں تیزی سے شامل ہو رہے ہیں، صنعت کو ایک مستقل رکاوٹ کا سامنا ہے: یہاں تک کہ جدید ترین ماڈلز میں بھی غلط معلومات (hallucinate) فراہم کرنے کا رجحان پایا جاتا ہے۔ اسٹارٹ اپ Probably اس چیلنج کا ڈٹ کر مقابلہ کر رہا ہے، اور اس نے AI کی بھروسہ مندی کے لیے ایک زیادہ سخت اور یقینی (deterministic) طریقہ کار تیار کرنے کے لیے Andreessen Horowitz کی قیادت میں 9 ملین ڈالر کی سیڈ فنڈنگ حاصل کی ہے۔

99.99% درستگی کی طرف پیش قدمی

بانی Peter Elias کی قیادت میں Probably کا بنیادی مشن LLMs کی احتمالی نوعیت (probabilistic nature) اور یقینی سسٹمز (deterministic systems) سے متوقع 99.99% درستگی کے معیار کے درمیان فرق کو ختم کرنا ہے۔ حساس ماحول میں، ایک بھی حقیقت پر مبنی غلطی AI ٹول کو بے کار بنا سکتی ہے۔ اس مسئلے کو حل کرنے کے لیے، Probably اس خیال سے ہٹ کر کام کر رہا ہے کہ درستگی محض ماڈل کے سائز کا نتیجہ ہے، اور اس کے بجائے "harness engineering" پر توجہ مرکوز کر رہا ہے۔

کمپنی کی سب سے اہم پروڈکٹ ایک ڈیٹا سائنس ٹول ہے جسے پیچیدہ ڈیٹا سیٹس سے معلومات (insights) نکالنے کے لیے ڈیزائن کیا گیا ہے۔ عام چیٹ بوٹس کے برعکس جو صرف بات چیت پر مبنی جوابات دیتے ہیں، Probably کا ٹول ہر جواب کے ساتھ ایک مخصوص حوالہ (citation) اور ایک شفاف آڈٹ ٹریل فراہم کرتا ہے، جس سے صارفین ہر آؤٹ پٹ کے پیچھے موجود منطق کی تصدیق کر سکتے ہیں۔

"Data Science Mech Suit" آرکیٹیکچر

محض ایک بڑے ماڈل کی استدلال کی صلاحیتوں (reasoning capabilities) پر انحصار کرنے کے بجائے، Probably اس چیز کا استعمال کرتا ہے جسے Elias "data science mech suit" کہتے ہیں۔ یہ آرکیٹیکچر ایک پیچیدہ ہارس سسٹم (harness system) کے طور پر کام کرتا ہے جہاں LLM کے ابتدائی آؤٹ پٹ کی فوری طور پر ایک یقینی ویلیڈیٹر (deterministic validator) کے ذریعے جانچ پڑتال کی جاتی ہے۔

اگر LLM ایسا نتیجہ دیتا ہے جو بنیادی ڈیٹا سیٹ کے ساتھ مکمل طور پر مطابقت نہیں رکھتا، تو ویلیڈیٹر اسے مسترد کر دیتا ہے۔ اہم بات یہ ہے کہ LLM کو خاص طور پر اسی ویلیڈیٹر کے خلاف تربیت دی جاتی ہے، جس سے رفتار اور حقائق کی سالمیت کے لیے موزوں ایک کلوزڈ لوپ سسٹم (closed-loop system) بنتا ہے۔ یہ طریقہ کار ایک بنیادی اصول پر کام کرتا ہے: انجینئرنگ کے ذریعے سیاق و سباق (context) کو بہتر بنا کر اور ابہام کو کم کر کے، آپ ماڈل کو بغیر کسی بھاری کمپیوٹیشنل طاقت کے "درست کام کرنے" پر مجبور کر سکتے ہیں۔

چھوٹے اور مقامی ماڈلز کے ذریعے کارکردگی

Probably کے طریقہ کار کے اہم ترین تکنیکی اثرات میں سے ایک چھوٹے اور زیادہ موثر ماڈلز استعمال کرنے کی صلاحیت ہے۔ چونکہ "mech suit" ویلیڈیشن اور سیاق و سباق کی بہتری کا بھاری کام سنبھال لیتا ہے، اس لیے سسٹم ایسے ماڈلز پر کام کر سکتا ہے جو "frontier models سے چار درجے کمزور" ہوں۔

اس تبدیلی کے وسیع اقتصادی اور آپریشنل فوائد ہیں:

بڑے AI لیب انسنٹیو ماڈل کو چیلنج کرنا

الیاس موجودہ AI منظرنامے میں ایک ساختی عدم مطابقت کی نشاندہی کرتے ہیں: بڑے AI لیبز کو ایسے بڑے پیمانے کے، عمومی مقصد کے حامل ماڈلز بنانے کی ترغیب دی جاتی ہے جنہیں بار بار صارف کی اصلاح کی ضرورت ہوتی ہے۔ چونکہ یہ لیبز اکثر ٹکن کے استعمال کی بنیاد پر چارج کرتی ہیں، اس لیے زیادہ غلطیاں اور زیادہ فالو اپ سوالات درحقیقت آمدنی میں اضافہ کر سکتے ہیں۔ پیمانے کے بجائے انجینئرنگ کے ذریعے درستگی اور "ابہام کو کم کرنے" پر توجہ مرکوز کر کے، Probably مشن کے لیے اہم AI ایپلی کیشنز کے لیے ایک خاص مقام بنا رہا ہے جہاں صرف بھروسہ مندی ہی واحد پیمانہ ہے جو اہمیت رکھتا ہے۔

اہم نکات