غالباً درست انجینئرنگ کے ذریعے LLM کے ہیلو سینیشنز (Hallucinations) کا مقابلہ کرنے کے لیے 9 ملین ڈالر جمع کیے

📅2 hours ago⏱3 min read

In this article

Probably نے پریسیژن انجینئرنگ کے ذریعے LLM Hallucinations کا مقابلہ کرنے کے لیے $9 ملین جمع کیے

جیسے جیسے Large Language Models (LLMs) پیشہ ورانہ کاموں (workflows) میں تیزی سے شامل ہو رہے ہیں، صنعت کو ایک مستقل رکاوٹ کا سامنا ہے: یہاں تک کہ جدید ترین ماڈلز میں بھی غلط معلومات (hallucinate) فراہم کرنے کا رجحان پایا جاتا ہے۔ اسٹارٹ اپ Probably اس چیلنج کا ڈٹ کر مقابلہ کر رہا ہے، اور اس نے AI کی بھروسہ مندی کے لیے ایک زیادہ سخت اور یقینی (deterministic) طریقہ کار تیار کرنے کے لیے Andreessen Horowitz کی قیادت میں 9 ملین ڈالر کی سیڈ فنڈنگ حاصل کی ہے۔

99.99% درستگی کی طرف پیش قدمی

بانی Peter Elias کی قیادت میں Probably کا بنیادی مشن LLMs کی احتمالی نوعیت (probabilistic nature) اور یقینی سسٹمز (deterministic systems) سے متوقع 99.99% درستگی کے معیار کے درمیان فرق کو ختم کرنا ہے۔ حساس ماحول میں، ایک بھی حقیقت پر مبنی غلطی AI ٹول کو بے کار بنا سکتی ہے۔ اس مسئلے کو حل کرنے کے لیے، Probably اس خیال سے ہٹ کر کام کر رہا ہے کہ درستگی محض ماڈل کے سائز کا نتیجہ ہے، اور اس کے بجائے "harness engineering" پر توجہ مرکوز کر رہا ہے۔

کمپنی کی سب سے اہم پروڈکٹ ایک ڈیٹا سائنس ٹول ہے جسے پیچیدہ ڈیٹا سیٹس سے معلومات (insights) نکالنے کے لیے ڈیزائن کیا گیا ہے۔ عام چیٹ بوٹس کے برعکس جو صرف بات چیت پر مبنی جوابات دیتے ہیں، Probably کا ٹول ہر جواب کے ساتھ ایک مخصوص حوالہ (citation) اور ایک شفاف آڈٹ ٹریل فراہم کرتا ہے، جس سے صارفین ہر آؤٹ پٹ کے پیچھے موجود منطق کی تصدیق کر سکتے ہیں۔

"Data Science Mech Suit" آرکیٹیکچر

محض ایک بڑے ماڈل کی استدلال کی صلاحیتوں (reasoning capabilities) پر انحصار کرنے کے بجائے، Probably اس چیز کا استعمال کرتا ہے جسے Elias "data science mech suit" کہتے ہیں۔ یہ آرکیٹیکچر ایک پیچیدہ ہارس سسٹم (harness system) کے طور پر کام کرتا ہے جہاں LLM کے ابتدائی آؤٹ پٹ کی فوری طور پر ایک یقینی ویلیڈیٹر (deterministic validator) کے ذریعے جانچ پڑتال کی جاتی ہے۔

اگر LLM ایسا نتیجہ دیتا ہے جو بنیادی ڈیٹا سیٹ کے ساتھ مکمل طور پر مطابقت نہیں رکھتا، تو ویلیڈیٹر اسے مسترد کر دیتا ہے۔ اہم بات یہ ہے کہ LLM کو خاص طور پر اسی ویلیڈیٹر کے خلاف تربیت دی جاتی ہے، جس سے رفتار اور حقائق کی سالمیت کے لیے موزوں ایک کلوزڈ لوپ سسٹم (closed-loop system) بنتا ہے۔ یہ طریقہ کار ایک بنیادی اصول پر کام کرتا ہے: انجینئرنگ کے ذریعے سیاق و سباق (context) کو بہتر بنا کر اور ابہام کو کم کر کے، آپ ماڈل کو بغیر کسی بھاری کمپیوٹیشنل طاقت کے "درست کام کرنے" پر مجبور کر سکتے ہیں۔

چھوٹے اور مقامی ماڈلز کے ذریعے کارکردگی

Probably کے طریقہ کار کے اہم ترین تکنیکی اثرات میں سے ایک چھوٹے اور زیادہ موثر ماڈلز استعمال کرنے کی صلاحیت ہے۔ چونکہ "mech suit" ویلیڈیشن اور سیاق و سباق کی بہتری کا بھاری کام سنبھال لیتا ہے، اس لیے سسٹم ایسے ماڈلز پر کام کر سکتا ہے جو "frontier models سے چار درجے کمزور" ہوں۔

اس تبدیلی کے وسیع اقتصادی اور آپریشنل فوائد ہیں:

ٹکن اخراجات میں کمی: چھوٹے ماڈلز فی کوئری لاگت کو نمایاں طور پر کم کر دیتے ہیں، جو کہ ایک اہم عنصر ہے کیونکہ ادارے اپنے AI بجٹ کو بہتر بنانے کی کوشش کر رہے ہیں۔
مقامی ایگزیکیوشن: یہ ہلکے ماڈلز مہنگے اور زیادہ لیٹنسی والے ڈیٹا سینٹر کنکشنز کے بجائے مقامی ہارڈ ویئر، جیسے کہ ڈیسک ٹاپ کمپیوٹرز پر چل سکتے ہیں۔
اسکیل ایبلٹی: یہ انجن ڈیٹا سائنس سے آگے اکاؤنٹنگ اور طبی خدمات جیسے درستگی کے حساس شعبوں تک توسیع پذیر ہونے کے لیے ڈیزائن کیا گیا ہے۔

بڑے AI لیب انسنٹیو ماڈل کو چیلنج کرنا

الیاس موجودہ AI منظرنامے میں ایک ساختی عدم مطابقت کی نشاندہی کرتے ہیں: بڑے AI لیبز کو ایسے بڑے پیمانے کے، عمومی مقصد کے حامل ماڈلز بنانے کی ترغیب دی جاتی ہے جنہیں بار بار صارف کی اصلاح کی ضرورت ہوتی ہے۔ چونکہ یہ لیبز اکثر ٹکن کے استعمال کی بنیاد پر چارج کرتی ہیں، اس لیے زیادہ غلطیاں اور زیادہ فالو اپ سوالات درحقیقت آمدنی میں اضافہ کر سکتے ہیں۔ پیمانے کے بجائے انجینئرنگ کے ذریعے درستگی اور "ابہام کو کم کرنے" پر توجہ مرکوز کر کے، Probably مشن کے لیے اہم AI ایپلی کیشنز کے لیے ایک خاص مقام بنا رہا ہے جہاں صرف بھروسہ مندی ہی واحد پیمانہ ہے جو اہمیت رکھتا ہے۔

اہم نکات

ڈیٹرمینسٹک ویلیڈیشن: Probably LLM کے نتائج کو ایک ڈیٹرمینسٹک ویلیڈیٹر کے خلاف چیک کرنے کے لیے "mech suit" آرکیٹیکچر کا استعمال کرتا ہے، جس کا مقصد 99.99% درستگی حاصل کرنا ہے۔
کاسٹ ایفیکٹیو انجینئرنگ: بہتر سیاق و سباق کی انجینئرنگ کے ذریعے ابہام کو کم کر کے، یہ سسٹم بہت چھوٹے اور سستے ماڈلز پر چل سکتا ہے جو مقامی ہارڈ ویئر پر کام کر سکتے ہیں۔
درستگی کو ترجیح دینا: یہ ٹیکنالوجی AI کو طب اور مالیات جیسی حساس اور زیادہ اہمیت والی صنعتوں میں لے جانے کے لیے ڈیزائن کی گئی ہے جہاں ہالوسینیشنز ناقابل قبول ہیں۔

غالباً درست انجینئرنگ کے ذریعے LLM کے ہیلو سینیشنز (Hallucinations) کا مقابلہ کرنے کے لیے 9 ملین ڈالر جمع کیے

Probably نے پریسیژن انجینئرنگ کے ذریعے LLM Hallucinations کا مقابلہ کرنے کے لیے $9 ملین جمع کیے

99.99% درستگی کی طرف پیش قدمی

"Data Science Mech Suit" آرکیٹیکچر

چھوٹے اور مقامی ماڈلز کے ذریعے کارکردگی

بڑے AI لیب انسنٹیو ماڈل کو چیلنج کرنا

اہم نکات

Continue reading

𝗙𝗶𝘅𝗶𝗻𝗴 𝗔𝗜 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗼𝗻𝘀

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

اے آئی ریڈ ٹیمنگ: لارج لینگویج ماڈلز کو مخالفانہ خطرات سے محفوظ بنانا

MA ProofBench: GPT 5.5 نے ریاضی کے تجزیے میں 16% کامیابی حاصل کی

موثر LLM سرونگ کی جانب