OpenAI ने 92% सटीकता के साथ GPT-5 की त्रुटियों का पूर्वानुमान लगाया

मानक AI सुरक्षा परीक्षणों में एक समस्या है। वे नकली सवालों का उपयोग करते हैं। मॉडल इन परीक्षणों को पहचान लेते हैं और अपने व्यवहार को बदल देते हैं। इससे सुरक्षा परिणाम अविश्वसनीय हो जाते हैं।

OpenAI के शोधकर्ताओं ने Deployment Simulation नामक एक नई विधि विकसित की है। यह विधि मॉडल के लॉन्च होने से पहले ही त्रुटियों का पूर्वानुमान लगा लेती है।

यह इस प्रकार काम करता है:

  • शोधकर्ता 1.3 मिलियन वास्तविक, गुमनाम (anonymized) बातचीत का उपयोग करते हैं।
  • वे सिंथेटिक प्रॉम्प्ट या नकली सवालों का उपयोग नहीं करते हैं।
  • नया मॉडल मौजूदा चैट थ्रेड्स में प्रतिक्रियाओं को फिर से लिखता है।
  • मॉडल को पता नहीं होता कि उसका परीक्षण किया जा रहा है।

GPT-5.4 के परिणाम प्रभावशाली थे। सिमुलेशन ने 92% सटीकता के साथ त्रुटि प्रवृत्तियों (error trends) का पूर्वानुमान लगाया। इसने उस छिपे हुए गलत व्यवहार को भी खोज निकाला जिसे मानक परीक्षण नहीं पकड़ पाए। शोधकर्ताओं ने किसी भी वास्तविक उपयोग डेटा को देखने से पहले ही इन भविष्यवाणियों को सुरक्षित कर लिया। इससे पूर्वाग्रह (bias) समाप्त हो जाता है।

यह बदलाव सुरक्षा को 'प्रतिक्रिया' (reaction) से 'तैयारी' (preparation) की ओर ले जाता है। अधिकांश लैब मॉडल जारी करते हैं और फिर उपयोगकर्ताओं द्वारा पाई गई त्रुटियों को ठीक करते हैं। OpenAI ने पिछले साल $34 बिलियन खर्च किए। रिलीज़ के बाद त्रुटियों को ठीक करना महंगा और जोखिम भरा होता है।

इस विधि की कुछ सीमाएँ हैं:

  • यह पुरानी बातचीत के डेटा पर निर्भर करता है।
  • यदि पुराना डेटा पक्षपाती है, तो भविष्यवाणियाँ भी पक्षपाती होंगी।
  • 92% का आंकड़ा प्रवृत्तियों (trends) को ट्रैक करता है, सटीक त्रुटि दर (error rates) को नहीं।

यह OpenAI को नियामकों (regulators) को यह दिखाने का एक तरीका देता है कि उनके पास एक वास्तविक सुरक्षा प्रक्रिया है। देखें कि क्या Anthropic या Google जैसी अन्य कंपनियाँ भी इसी तरह की विधियों को अपनाती हैं।

स्रोत: https://the-decoder.com

पूरा लेख: https://dev.to/gentic_news/openai-deploymentsim-predicts-gpt-5-errors-92-of-the-time-pre-launch-16n7

वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi