𝗢𝗽𝗲𝗻𝗔𝗜 𝗣𝗿𝗲𝗱𝗶𝗰𝘁𝘀 𝗠𝗼𝗱𝗲𝗹 𝗙𝗮𝗶𝗹𝘂𝗿𝗲𝘀 𝗨𝘀𝗶𝗻𝗴 𝗣𝗮𝘀𝘁 𝗖𝗵𝗮𝘁𝘀

Translated for your language. Read the original.

AI-assisted draft.

گزشتہ کل1min read

OpenAI ماضی کی چیٹس کا استعمال کرتے ہوئے ماڈل کی ناکامیوں کی پیش گوئی کرتا ہے

OpenAI نے یہ پیش گوئی کرنے کا طریقہ ڈھونڈ لیا ہے کہ کوئی ماڈل کب ناکام ہوگا۔ وہ ایسا پرانی صارف چیٹس کو دوبارہ چلا کر کرتے ہیں۔

یہ طریقہ تاریخی لاگز میں غلطی کے پیٹرنز تلاش کرتا ہے۔ اسے نئے لیبل شدہ ڈیٹا کی ضرورت نہیں ہوتی۔ اس سے سیفٹی ٹیسٹنگ تیز اور سستی ہو جاتی ہے۔

یہ کیسے کام کرتا ہے:

سسٹم ماڈل کے ذریعے ماضی کی حقیقی گفتگو کو دوبارہ چلا کر دیکھتا ہے۔
یہ پچھلی غلطیوں کے نشانات تلاش کرتا ہے۔
یہ بار بار ہونے والی غلط فہمیوں یا ایج کیسز (edge cases) کو تلاش کرتا ہے۔
یہ نشاندہی کرتا ہے کہ ماڈل درست جوابات سے کہاں ہٹ جاتا ہے۔

روایتی ٹیسٹنگ میں اکثر نایاب غلطیاں رہ جاتی ہیں۔ یہ نیا طریقہ ان خامیوں کو تلاش کرنے کے لیے صارفین کے حقیقی رویے کا استعمال کرتا ہے۔ یہ فرضی ٹیسٹ کیسز بنانے کے بجائے موجودہ ڈیٹا پر انحصار کرتا ہے۔

موجودہ حدود: OpenAI نے ابھی تک مخصوص اعداد و شمار شیئر نہیں کیے ہیں۔ ہمیں غلطی کی شرح یا بینچ مارک اسکورز کا علم نہیں ہے۔ ہمیں یہ بھی نہیں معلوم کہ آیا یہ طریقہ GPT-5 جیسے مستقبل کے ماڈلز کے لیے کام کرے گا۔

کس چیز پر نظر رکھنی چاہیے: کسی تکنیکی رپورٹ یا arXiv پیپر کا انتظار کریں۔ پیش گوئی کی گئی ناکامیوں اور اصل ڈیپلائمنٹ کی غلطیوں کے درمیان تعلق کو دیکھیں۔ اس سے معلوم ہوگا کہ آیا یہ طریقہ بڑے پیمانے پر کام کرتا ہے۔

ماخذ: https://dev.to/gentic_news/openai-can-predict-model-failures-via-past-chat-replay-2hej

اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi

𝗢𝗽𝗲𝗻𝗔𝗜 𝗣𝗿𝗲𝗱𝗶𝗰𝘁𝘀 𝗠𝗼𝗱𝗲𝗹 𝗙𝗮𝗶𝗹𝘂𝗿𝗲𝘀 𝗨𝘀𝗶𝗻𝗴 𝗣𝗮𝘀𝘁 𝗖𝗵𝗮𝘁𝘀

Continue reading

لانچ سے پہلے کے اے آئی سیمولیشنز اب ماڈل سیفٹی چیک کا نیا معیار ہیں

لانچ سے پہلے کی اے آئی سیمولیشنز اب نیا حفاظتی چیک ہیں

OpenAI Proposes Deployment Simulation to Predict AI Failures

𝗢𝗽𝗲𝗻𝗔𝗜 𝗣𝗿𝗲𝗱𝗶𝗰𝘁𝘀 𝗚𝗣𝗧 𝟱 𝗘𝗿𝗿𝗼𝗿𝘀 𝗪𝗶𝘁𝗵 𝟵𝟮% 𝗔𝗰𝗰𝘂𝗿𝗮𝗰𝘆

چیٹ جی پی ٹی 4 کا عملی استعمال