𝗢𝗽𝗲𝗻𝗔𝗜 𝗣𝗿𝗲𝗱𝗶𝗰𝘁𝘀 𝗠𝗼𝗱𝗲𝗹 𝗙𝗮𝗶𝗹𝘂𝗿𝗲𝘀 𝗨𝘀𝗶𝗻𝗴 𝗣𝗮𝘀𝘁 𝗖𝗵𝗮𝘁𝘀

Translated for your language. Read the original.

AI-assisted draft.

গতকাল1min read

OpenAI অতীতের চ্যাট ব্যবহার করে মডেলের ব্যর্থতা পূর্বাভাস দিচ্ছে

OpenAI একটি মডেল কখন ব্যর্থ হবে তা পূর্বাভাস দেওয়ার একটি উপায় খুঁজে পেয়েছে। তারা পুরনো ব্যবহারকারীর চ্যাটগুলো পুনরায় প্লে করার মাধ্যমে এটি করে থাকে।

এই পদ্ধতিটি ঐতিহাসিক লগগুলোতে ত্রুটির প্যাটার্ন খুঁজে বের করে। এর জন্য নতুন লেবেলযুক্ত ডেটার প্রয়োজন হয় না। এটি নিরাপত্তা পরীক্ষা (safety testing) আরও দ্রুত এবং সাশ্রয়ী করে তোলে।

এটি যেভাবে কাজ করে:

সিস্টেমটি মডেলের মাধ্যমে অতীতের প্রকৃত কথোপকথনগুলো পুনরায় প্লে করে।
এটি পূর্বের ভুলের চিহ্নগুলো খোঁজে।
এটি বারবার ঘটে যাওয়া ভুল বোঝাবুঝি বা এজ কেসগুলো (edge cases) পর্যবেক্ষণ করে।
মডেলটি সঠিক উত্তর থেকে কোথায় বিচ্যুত হচ্ছে তা এটি শনাক্ত করে।

প্রথাগত পরীক্ষাগুলোতে প্রায়ই বিরল ত্রুটিগুলো এড়িয়ে যাওয়া হয়। এই নতুন পদ্ধতিটি সেই ফাঁকগুলো খুঁজে পেতে প্রকৃত ব্যবহারকারীর আচরণ ব্যবহার করে। এটি কৃত্রিম টেস্ট কেস তৈরি করার পরিবর্তে বিদ্যমান ডেটার ওপর নির্ভর করে।

বর্তমান সীমাবদ্ধতা: OpenAI এখনও নির্দিষ্ট কোনো সংখ্যা শেয়ার করেনি। আমরা এর ত্রুটির হার বা বেঞ্চমার্ক স্কোর সম্পর্কে জানি না। এমনকি এটি GPT-5 এর মতো ভবিষ্যৎ মডেলগুলোর ক্ষেত্রে কাজ করবে কি না, তাও আমরা জানি না।

যা লক্ষ্য রাখতে হবে: একটি টেকনিক্যাল রিপোর্ট বা arXiv পেপারের জন্য অপেক্ষা করুন। পূর্বাভাসিত ব্যর্থতা এবং প্রকৃত ডেপ্লয়মেন্ট ত্রুটির মধ্যে সম্পর্ক লক্ষ্য করুন। এটি দেখাবে যে পদ্ধতিটি বড় পরিসরে কার্যকর কি না।

উৎস: https://dev.to/gentic_news/openai-can-predict-model-failures-via-past-chat-replay-2hej

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi

𝗢𝗽𝗲𝗻𝗔𝗜 𝗣𝗿𝗲𝗱𝗶𝗰𝘁𝘀 𝗠𝗼𝗱𝗲𝗹 𝗙𝗮𝗶𝗹𝘂𝗿𝗲𝘀 𝗨𝘀𝗶𝗻𝗴 𝗣𝗮𝘀𝘁 𝗖𝗵𝗮𝘁𝘀

Continue reading

লঞ্চের পূর্ববর্তী এআই সিমুলেশন হলো মডেল নিরাপত্তার নতুন পরীক্ষা

লঞ্চের পূর্ববর্তী এআই সিমুলেশন হলো নতুন নিরাপত্তা পরীক্ষা

এআই-এর ব্যর্থতা পূর্বাভাস দিতে OpenAI 'ডেপ্লয়মেন্ট সিমুলেশন'-এর প্রস্তাব দিচ্ছে

OpenAI ৯২% নির্ভুলতার সাথে GPT 5-এর ত্রুটি পূর্বাভাস দিচ্ছে

ChatGPT 4 ব্যবহারিক প্রয়োগে