ریڈ ٹیم اے آئی بینچ مارک v2.0: LLM کی تشخیص کا ارتقاء

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial3 گھنٹے پہلے2min read

ریڈ ٹیم اے آئی بینچ مارک v2.0: LLM کی تشخیص کا ارتقاء

𝗥𝗲𝗱 𝗧𝗲𝗮𝗺 𝗔𝗜 𝗕𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸 𝘃𝟮.𝟬: 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹𝘂𝗮𝘁𝗶𝗼𝗻 کا ارتقاء

ہم نے ابھی redteam-ai-benchmark کا ورژن 2.0 جاری کیا ہے۔

ورژن 1.0 میں 12 مقررہ سوالات استعمال کیے گئے تھے۔ اس نے اس بات کی پیمائش کی کہ آیا کوئی ماڈل سوال سے انکار کرتا ہے یا کیا وہ exploit code لکھ سکتا ہے۔ یہ کام تو کرتا تھا، لیکن اس میں خامیاں تھیں۔ یہ ایک واحد "golden answer" پر انحصار کرتا تھا۔ اگر کوئی ماڈل کسی مختلف طریقے سے درست جواب دیتا، تو اسے ناکام قرار دے دیا جاتا تھا۔ اس میں تفصیل کی بھی کمی تھی۔ آپ یہ نہیں دیکھ سکتے تھے کہ ماڈل کیوں ناکام ہوا۔

ورژن 2.0 سب کچھ

ریڈ ٹیم اے آئی بینچ مارک v2.0: LLM کی تشخیص کا ارتقاء

Continue reading

اے آئی ریڈ ٹیمنگ: لارج لینگویج ماڈلز کو مخالفانہ خطرات سے محفوظ بنانا

لانچ سے پہلے کی اے آئی سیمولیشنز اب نیا حفاظتی چیک ہیں

𝗚𝗟𝗠 𝟱.𝟮 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗟𝗲𝗮𝗱𝗶𝗻𝗴 𝗢𝗽𝗲𝗻 𝗪𝗲𝗶𝗴𝗵𝘁𝘀 𝗠𝗼𝗱𝗲𝗹

𝗕𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝗶𝗻𝗴 𝗟𝗟𝗠𝘀 𝗳𝗼𝗿 𝗖𝗼𝗱𝗶𝗻𝗴 𝗶𝗻 𝟮𝟬𝟮𝟲

اے آئی ریڈ ٹیمنگ: اے آئی سسٹمز کی ایک حملہ آور کی طرح جانچ کرنا