OpenAI கடந்த கால உரையாடல்களைப் பயன்படுத்தி மாடல் தோல்விகளைக் கணிக்கிறது

ஒரு மாடல் எப்போது தோல்வியடையும் என்பதைக் கணிக்க OpenAI ஒரு வழியைக் கண்டறிந்துள்ளது. பழைய பயனர் உரையாடல்களை மீண்டும் இயக்குவதன் மூலம் அவர்கள் இதைச் செய்கிறார்கள்.

இந்த முறை வரலாற்றுப் பதிவுகளில் உள்ள பிழை முறைகளைக் கண்டறிகிறது. இதற்கு புதிய லேபிளிடப்பட்ட தரவுகள் தேவையில்லை. இது பாதுகாப்புச் சோதனையை வேகமாகவும் மலிவாகவும் மாற்றுகிறது.

இது எவ்வாறு செயல்படுகிறது:

  • இந்த அமைப்பு கடந்த கால உண்மையான உரையாடல்களை மாடல் மூலம் மீண்டும் இயக்குகிறது.
  • இது முந்தைய தவறுகளின் தடயங்களைத் தேடுகிறது.
  • இது மீண்டும் மீண்டும் நிகழும் தவறான புரிதல்கள் அல்லது விளிம்புநிலைச் சூழல்களைத் தேடுகிறது.
  • மாடல் சரியான பதில்களில் இருந்து எங்கு விலகிச் செல்கிறது என்பதை இது அடையாளம் காண்கிறது.

பாரம்பரியச் சோதனைகள் பெரும்பாலும் அரிதான பிழைகளைக் கண்டறிவதில்லை. இந்த புதிய அணுகுமுறை அந்த இடைவெளிகளைக் கண்டறிய உண்மையான பயனர் நடத்தையைப் பயன்படுத்துகிறது. இது போலியான சோதனைத் தரவுகளை உருவாக்குவதற்குப் பதிலாக, ஏற்கனவே உள்ள தரவுகளைச் சார்ந்து செயல்படுகிறது.

தற்போதைய வரம்புகள்: OpenAI இன்னும் குறிப்பிட்ட எண்களைப் பகிர்ந்து கொள்ளவில்லை. பிழை விகிதங்கள் அல்லது பெஞ்ச்மார்க் மதிப்பெண்கள் பற்றி நமக்குத் தெரியாது. மேலும், இது GPT-5 போன்ற எதிர்கால மாடல்களுக்குப் பயன்படுமா என்பதையும் நாம் அறியவில்லை.

எதைக் கவனிக்க வேண்டும்: ஒரு தொழில்நுட்ப அறிக்கை அல்லது arXiv ஆய்வறிக்கையை எதிர்பார்க்கவும். கணிக்கப்பட்ட தோல்விகளுக்கும், உண்மையான பயன்பாட்டுப் பிழைகளுக்கும் இடையிலான தொடர்பைக் கவனியுங்கள். இது இந்த முறை பெரிய அளவில் செயல்படுகிறதா என்பதைக் காட்டும்.

ஆதாரம்: https://dev.to/gentic_news/openai-can-predict-model-failures-via-past-chat-replay-2hej

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi