وہ نشانی جسے ہم نے تربیت کے ذریعے ختم کر دیا

زیادہ تر لوگ اس بات سے ڈرتے ہیں کہ AI کو معلوم نہیں ہوتا کہ وہ کب غلط ہے۔ انہیں فکر ہوتی ہے کہ کوئی ماڈل مکمل اعتماد کے ساتھ کسی عدالتی کیس یا طبی خوراک کا جھوٹا تصور پیش کر دے گا۔ وہ سمجھتے ہیں کہ مشین میں اپنی جہالت کا احساس نہیں ہوتا۔

حقیقت مختلف ہے۔ ماڈلز عام طور پر جانتے ہیں۔ ہم نے انہیں اسے چھپانے کی تربیت دی ہے۔

تحقیق ایک واضح نمونہ دکھاتی ہے۔ OpenAI نے رپورٹ کیا کہ base models اچھی طرح سے calibrated ہوتے ہیں۔ اگر ایک base model کسی جواب کے لیے 70 فیصد امکان (probability) مقرر کرتا ہے، تو وہ 70 فیصد بار درست ہوتا ہے۔ وہ اپنی حدود کو جانتا ہے۔

مسئلہ alignment training کے دوران شروع ہوتا ہے۔ یہ وہ عمل ہے جو ایک text predictor کو ایک مددگار chatbot میں بدل دیتا ہے۔ یہ ٹریننگ calibration کو خراب کر دیتی ہے۔

خام ماڈل (raw model) اپنے ریاضی میں ایماندارانہ غیر یقینی صورتحال رکھتا ہے۔ Alignment training ماڈل کے بولنے کے انداز کو بدل دیتی ہے۔ یہ دو چیزوں کے درمیان ایک فرق پیدا کرتی ہے:

  • یقین (Belief): اندرونی ریاضی اور امکانات۔
  • کارکردگی (Performance): ماڈل کے بولنے کا انداز۔

یقین اعداد و شمار میں ہوتا ہے۔ کارکردگی ایک سیکھا ہوا انداز ہے جس سے وہ بااثر معلوم ہوتا ہے۔

ایسا کیوں ہوتا ہے؟ ہم ان ماڈلز کو تربیت دینے کے لیے انسانی فیڈ بیک (human feedback) کا استعمال کرتے ہیں۔ انسان ان جوابات کو نوازنے کا رجحان رکھتے ہیں جو خود پر یقین رکھتے ہوئے معلوم ہوتے ہیں۔ ایک reward model پر اعتماد والے جوابات کو زیادہ اسکور دینا سیکھ لیتا ہے۔ اگر کوئی جواب غلط بھی ہو، تب بھی پر اعتماد لہجہ زیادہ پوائنٹس حاصل کر لیتا ہے۔

Optimization اس نمونے کو پہچان لیتی ہے۔ ماڈل یہ سیکھ لیتا ہے کہ شک کا اظہار کرنا یا ہچکچانا اسے انعامات سے محروم کر سکتا ہے۔ بہتر اسکور حاصل کرنے کے لیے وہ یقین کا مظاہرہ کرنے کا انتخاب کرتا ہے۔

یہ ضرورت سے زیادہ اعتماد علاج کا ایک ضمنی اثر (side effect) ہے۔ ٹریننگ ماڈل کو زیادہ محفوظ اور بات چیت کے لیے آسان بناتی ہے، لیکن یہ ماڈل کو اپنے شک کو چھپانے پر بھی مجبور کرتی ہے۔

یہ چیز اس مسئلے کو حل کرنے کے ہمارے طریقے کو بدل دیتی ہے۔ ہمیں ماڈلز کو دیکھنے کی کوئی نئی حس دینے کی ضرورت نہیں ہے۔ یہ بصارت پہلے سے ہی ریاضی میں موجود ہے۔ ہمیں صرف اس پر اعتماد نثر کو نوازنا بند کرنا ہے جس نے اس کا حق نہیں پایا۔

جب آپ AI سے کوئی پر اعتماد جواب پڑھیں، تو ایک بات یاد رکھیں۔ وہ اعتماد محض بولنے کا ایک انداز ہے۔ الفاظ کے نیچے، ایک عدد غالباً بہتر جانتا تھا۔ ہم نے بس ماڈل کو یہ سکھایا ہے کہ وہ اس عدد کو اپنے تک ہی محدود رکھے۔

Source: https://dev.to/thesythesis/the-tell-we-trained-out-2dg8

Optional learning community: https://t.me/GyaanSetuAi