सॅम ऑल्टमॅनचा दावा: स्केलिंगच्या संशयकांमुळे एआय (AI) विकासात अडथळा निर्माण झाला
OpenAI चे CEO सॅम ऑल्टमॅन स्केलिंगच्या (scaling) शक्तीवर अधिक भर देत आहेत. त्यांच्या मते, संशोधकांच्या मागील पिढीने लार्ज लँग्वेज मॉडेल्सच्या (LLMs) क्षमतेचा कमी अंदाज घेतल्यामुळे प्रगती खुंटली आहे. ट्रान्सफॉर्मर आर्किटेक्चरच्या (transformer architectures) मर्यादांबाबत वाद वाढत असतानाच, ऑल्टमॅन असा दावा करत आहेत की, संगणकीय क्षमता (compute) आणि डेटाच्या निरंतर विस्तारणाचे समर्थन करणारे अनुभवजन्य पुरावे (empirical evidence) मोठ्या प्रमाणात उपलब्ध आहेत.
बौद्धिक कट्टरतेची किंमत
स्टॅनफोर्डमधील एका अलीकडील कार्यक्रमात, ऑल्टमॅन यांनी स्केलिंगचे समर्थक आणि संशयवादी यांच्यातील संघर्षावर भाष्य केले. त्यांनी विशेषतः मेटाचे (Meta) यान लेकन (Yann LeCun) यांच्यासारख्या टीकाकारांचा उल्लेख केला, ज्यांनी LLMs ला "डेड एंड" (dead end) असे संबोधले आहे. ऑल्टमॅन यांच्या मते, स्केलिंग सिद्धांताला (scaling hypothesis) होणारा विरोध हा संशोधकांच्या त्या अतिआत्मविश्वासातून निर्माण होतो, ज्याद्वारे ते एआय (AI) काय करू शकत नाही याच्या अंदाजांवर ठाम असतात.
त्यांनी असा युक्तिवाद केला की, उद्योगातील काही प्रमुख व्यक्तींनी आपली व्यावसायिक ओळख विशिष्ट सैद्धांतिक भूमिकांशी जोडली आहे, ज्यामुळे त्यांच्या जुन्या धारणांना छेद देणाऱ्या नवीन डेटाचा ते स्वीकार करण्यास तयार नाहीत. रोबोटिक्ससारख्या क्षेत्रातील प्रगतीसाठी "वर्ल्ड मॉडेल्स" (world models) आवश्यक असल्याचे मान्य करत असतानाच, ऑल्टमॅन असा ठामपणे मांडतात की LLMs चा सध्याचा मार्ग हा कोणताही वळण नसून, तो बुद्धिमत्तेचा मुख्य आधार आहे.
अनुभवजन्य पुरावा: पॅटर्न मॅचिंगच्या पलीकडे वाटचाल
स्केलिंगच्या समर्थनार्थ ऑल्टमॅन यांनी मांडलेला सर्वात महत्त्वाचा मुद्दा म्हणजे, LLMs केवळ मजकूर वर्तवणारे (text predictors) न राहता मूळ तर्कशक्ती (original reasoning) वापरण्यास सक्षम साधने बनत आहेत. त्यांनी एका अलीकडील टप्प्याचा (milestone) उल्लेख केला, जिथे OpenAI च्या एका मॉडेलने अशा एका गणितीय कल्पनेला (mathematical conjecture) यशस्वीरित्या खोडून काढले, जे मानवी तज्ज्ञांसाठी दीर्घकाळापासून सुटलेले नव्हते.
हा विकास अत्यंत महत्त्वाचा आहे कारण तो LLMs केवळ "स्टोकॅस्टिक पॅरट्स" (stochastic parrots) आहेत आणि ते खऱ्या शोधासाठी असमर्थ आहेत, या दाव्याला आव्हान देतो. "त्यामुळे हे स्पष्ट आहे की, LLMs नवीन ज्ञान शोधण्यास सक्षम आहेत," असे ऑल्टमॅन म्हणाले. त्यांनी असेही नमूद केले की, गणिती जग आता एआय-चालित पुराव्यांच्या (AI-driven proofs) परिणामांचा गांभीर्याने विचार करत आहे. हा बदल सुचवतो की स्केलिंग केवळ भाषेचा ओघ (fluency) सुधारत नाही, तर ते संज्ञानात्मक क्षमतेची (cognitive capability) व्याप्ती देखील वाढवते.
सीमा: तर्कशक्ती विरुद्ध दीर्घकालीन कार्ये (Long-Horizon Tasks)
त्याच्या आशावादाच्या असूनही, तंत्रज्ञानाच्या सध्याच्या मर्यादांबाबत ऑल्टमॅन वास्तववादी आहे. "long-horizon tasks"—असे जटिल वर्कफ्लो ज्यामध्ये दीर्घकाळ टिकणारे उच्च-स्तरीय निर्णय आणि बहु-स्तरीय नियोजनाची आवश्यकता असते—यांच्या संदर्भात त्याने कामगिरीतील स्पष्ट तफावत नमूद केली. या विशिष्ट क्षेत्रांमध्ये, त्याने कबूल केले की LLMs अजूनही "माणसांपेक्षा खूपच कमी प्रभावी वाटतात."
व्यापक AI क्षेत्रासाठी, हा फरक संशोधनाची पुढील सीमा निश्चित करतो. उद्योग आता "scaling for knowledge" च्या टप्प्यातून "scaling for reasoning and agency" कडे वळत आहे. OpenAI आणि Anthropic (CEO डारियो अमोडे यांच्या नेतृत्वाखाली, ज्यांचे ऑल्टमॅनच्या स्केलिंगवरील विश्वासाशी मिळतेजुळते मत आहे) सारख्या कंपन्या कॉम्प्युटवर (compute) अब्जावधी डॉलर्स खर्च करत असताना, तात्पुरती बुद्धिमत्ता आणि विश्वसनीय, दीर्घकालीन स्वायत्तता यांच्यातील अंतर कमी करणे हे मुख्य उद्दिष्ट आहे.
मुख्य निष्कर्ष
- स्केलिंग हा प्राथमिक चालक आहे: ऑल्टमॅनचा असा युक्तिवाद आहे की वाढीव कॉम्प्युट आणि डेटाच्या प्रभावाचा कमी अंदाज घेतल्यामुळे ऐतिहासिकदृष्ट्या AI मधील प्रगतीचा वेग मंदावला आहे.
- नक्कल करण्यापेक्षा शोध महत्त्वाचा: जटिल गणितीय कल्पना (conjectures) सोडवण्याची OpenAI मॉडेल्सची क्षमता हे सिद्ध करते की LLMs खऱ्या ज्ञान निर्मितीकडे वाटचाल करत आहेत.
- पुढील अडथळा: स्केलिंगमुळे अनेक समस्या सुटत असल्या तरी, दीर्घकालीन आणि उच्च-निर्णय घेणाऱ्या कामांमध्ये मानवी पातळीवरील कामगिरी हे उद्योगापुढील पुढील मोठे आव्हान आहे.