கடந்த கால உரையாடல்களைப் பயன்படுத்தி மாடல் தோல்விகளை OpenAI கணிக்கிறது

Translated for your language. Read the original.

AI-assisted draft.

நேற்று1min read

OpenAI கடந்த கால உரையாடல்களைப் பயன்படுத்தி மாடல் தோல்விகளைக் கணிக்கிறது

ஒரு மாடல் எப்போது தோல்வியடையும் என்பதைக் கணிக்க OpenAI ஒரு வழியைக் கண்டறிந்துள்ளது. பழைய பயனர் உரையாடல்களை மீண்டும் இயக்குவதன் மூலம் அவர்கள் இதைச் செய்கிறார்கள்.

இந்த முறை வரலாற்றுப் பதிவுகளில் உள்ள பிழை முறைகளைக் கண்டறிகிறது. இதற்கு புதிய லேபிளிடப்பட்ட தரவுகள் தேவையில்லை. இது பாதுகாப்புச் சோதனையை வேகமாகவும் மலிவாகவும் மாற்றுகிறது.

இது எவ்வாறு செயல்படுகிறது:

இந்த அமைப்பு கடந்த கால உண்மையான உரையாடல்களை மாடல் மூலம் மீண்டும் இயக்குகிறது.
இது முந்தைய தவறுகளின் தடயங்களைத் தேடுகிறது.
இது மீண்டும் மீண்டும் நிகழும் தவறான புரிதல்கள் அல்லது விளிம்புநிலைச் சூழல்களைத் தேடுகிறது.
மாடல் சரியான பதில்களில் இருந்து எங்கு விலகிச் செல்கிறது என்பதை இது அடையாளம் காண்கிறது.

பாரம்பரியச் சோதனைகள் பெரும்பாலும் அரிதான பிழைகளைக் கண்டறிவதில்லை. இந்த புதிய அணுகுமுறை அந்த இடைவெளிகளைக் கண்டறிய உண்மையான பயனர் நடத்தையைப் பயன்படுத்துகிறது. இது போலியான சோதனைத் தரவுகளை உருவாக்குவதற்குப் பதிலாக, ஏற்கனவே உள்ள தரவுகளைச் சார்ந்து செயல்படுகிறது.

தற்போதைய வரம்புகள்: OpenAI இன்னும் குறிப்பிட்ட எண்களைப் பகிர்ந்து கொள்ளவில்லை. பிழை விகிதங்கள் அல்லது பெஞ்ச்மார்க் மதிப்பெண்கள் பற்றி நமக்குத் தெரியாது. மேலும், இது GPT-5 போன்ற எதிர்கால மாடல்களுக்குப் பயன்படுமா என்பதையும் நாம் அறியவில்லை.

எதைக் கவனிக்க வேண்டும்: ஒரு தொழில்நுட்ப அறிக்கை அல்லது arXiv ஆய்வறிக்கையை எதிர்பார்க்கவும். கணிக்கப்பட்ட தோல்விகளுக்கும், உண்மையான பயன்பாட்டுப் பிழைகளுக்கும் இடையிலான தொடர்பைக் கவனியுங்கள். இது இந்த முறை பெரிய அளவில் செயல்படுகிறதா என்பதைக் காட்டும்.

ஆதாரம்: https://dev.to/gentic_news/openai-can-predict-model-failures-via-past-chat-replay-2hej

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi

கடந்த கால உரையாடல்களைப் பயன்படுத்தி மாடல் தோல்விகளை OpenAI கணிக்கிறது

Continue reading

அறிமுகத்திற்கு முந்தைய AI உருவகப்படுத்துதல்களே புதிய மாடல் பாதுகாப்புச் சரிபார்ப்பு முறை

அறிமுகத்திற்கு முந்தைய AI உருவகப்படுத்துதல்கள் புதிய பாதுகாப்புச் சரிபார்ப்பாகும்

AI தோல்விகளைக் கணிக்க OpenAI 'Deployment Simulation' முறையை முன்மொழிகிறது

OpenAI GPT 5 பிழைகளை 92% துல்லியத்துடன் கணிக்கிறது

𝗖𝗵𝗮𝘁𝗚𝗣𝗧 𝟰 𝗜𝗻 𝗣𝗿𝗮𝗰𝘁𝗶𝗰𝗲