AI साठी सर्वात मोठा धोका

बहुतेक लोकांना जागृत होणाऱ्या यंत्राची भीती वाटते.

खरा धोका अधिक शांत आहे. AI खूप हुशार झाल्यामुळे अपयशी ठरणार नाही. ते कदाचित आपण त्याला दिले जाणारे 'अन्न' (डेटा) विषारी केल्यामुळे अपयशी ठरू शकते.

२०२९ या वर्षाचा विचार करा. डेव्हलपर्स मोठ्या context windows आणि अधिक चांगल्या तर्कशक्तीसह (reasoning) नवीन मॉडेल्स प्रशिक्षित करतात. हे मॉडेल्स शिकवण्यासाठी ते इंटरनेटचा एक स्नॅपशॉट वापरतात. यामध्ये ब्लॉग्स, फोरम्स, बातम्या आणि सोशल मीडियाचा समावेश असतो.

पण इंटरनेट बदलत आहे.

अनेक वर्षांपासून, बॉट्स आणि विविध गट मोठ्या प्रमाणावर मजकूर (content) प्रकाशित करत आहेत. हा केवळ साधा स्पॅम नाही. तो सुव्यवस्थित लिहिलेला मजकूर आहे.

इंटरनेट आता ट्रेनिंग डेटासाठी एक रणमैदान बनत आहे.

जुना प्रोपोगंडा (प्रचार) लोकांना लक्ष्य करत असे. नवीन प्रोपोगंडा मॉडेल्सना लक्ष्य करत आहे. एकदा का ट्रेनिंग डेटामध्ये कोणताही पूर्वग्रह (bias) शिरला, की तो भविष्यातील लाखो AI सिस्टम्समध्ये कायम राहतो.

तुम्हाला तो बनावट लेख कदाचित कधीच दिसणार नाही. तुम्हाला तो फेरफार केलेला थ्रेड (thread) कदाचित कधीच सापडणार नाही. पण त्याचा प्रभाव कायम राहतो. ते एक 'डिफॉल्ट गृहीतक' बनते. ते असे उत्तर बनते जे ऐकायला योग्य वाटते.

डेटा पॉयझनिंग (Data poisoning) हा केवळ तांत्रिक हल्ला नाही. तो एक सूक्ष्म बदल आहे. तो मॉडेलला तोडत नाही, तर त्याला वाकवतो.

या जोखमींचा विचार करा:

  • बनावट पेजेसमुळे एखादे धोकादायक उत्पादन सुरक्षित असल्याचे भासते.
  • डेव्हलपर्समधील बनावट चॅट्समुळे खराब कोड 'बेस्ट प्रॅक्टिस' असल्यासारखा वाटतो.
  • राजकीय कथानके (narratives) अनेक वर्षे आधीच पेरली जातात.
  • कृत्रिम मते (Synthetic opinions) भविष्यातील असिस्टंटचा आवाज बनतात.

धोका म्हणजे केवळ एक खोटे बोलणे नाही. धोका म्हणजे वास्तवाचा विकृत नकाशा आहे.

लोक आता मानवी वाचकांऐवजी भविष्यातील मॉडेल्ससाठी मजकूर लिहित आहेत. एक ब्लॉग पोस्ट हे एक बीज आहे. एक बनावट रिव्ह्यू हे एक संकेत आहे. हजारो लहान खोट्या गोष्टी सांख्यिकीय सत्य (statistical truth) बनतात.

AI आपला गोंधळ (noise) आणि आपली फेरफार (manipulation) वारसा म्हणून स्वीकारते. जर इंटरनेट प्रदूषित असेल, तर मॉडेल्स आपले सर्वात वाईट विकृत स्वरूप शिकतील.

आपल्याला एक नवीन प्रश्न विचारावा लागेल. आपण फक्त 'आपण AI सुरक्षित करू शकतो का?' असे विचारून चालणार नाही. तर 'आपले ज्ञान AI ने शिकण्यासाठी पुरेसे सुरक्षित ठेवू शकतो का?' असा प्रश्न आपल्याला विचारावा लागेल.

आजचे इंटरनेट अशा लोकांकडून लिहिले जात आहे ज्यांना हे माहित आहे.

स्रोत: https://dev.to/marrouchi/the-greatest-danger-to-ai-6km

पर्यायी लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi