സ്കെയിലിംഗിനെ സംശയിക്കുന്നവർ AI വികസനത്തെ പിന്നോട്ടടിച്ചു എന്ന് സാം ആൾട്ട്മാൻ അവകാശപ്പെടുന്നു
സ്കെയിലിംഗിന്റെ (scaling) കരുത്തിൽ OpenAI സിഇഒ സാം ആൾട്ട്മാൻ വീണ്ടും ഊന്നൽ നൽകുന്നു. ലാർജ് ലാംഗ്വേജ് മോഡലുകളുടെ (LLMs) സാധ്യതകളെ കുറച്ചുകാണിച്ചതിലൂടെ മുൻതലമുറയിലെ ഗവേഷകർ പുരോഗതിയെ തടസ്സപ്പെടുത്തിയെന്ന് അദ്ദേഹം വാദിക്കുന്നു. ട്രാൻസ്ഫോർമർ ആർക്കിടെക്ചറുകളുടെ പരിമിതികളെക്കുറിച്ചുള്ള ചർച്ചകൾ ശക്തമാകുന്നതിനിടെ, കമ്പ്യൂട്ട് (compute), ഡാറ്റ എന്നിവയുടെ തുടർച്ചയായ വിപുലീകരണത്തിനാണ് അനുഭവസിദ്ധമായ തെളിവുകൾ വൻതോതിൽ അനുകൂലമായി നിൽക്കുന്നതെന്ന് ആൾട്ട്മാൻ ഉറപ്പിച്ചു പറയുന്നു.
ബൗദ്ധികമായ കടുംപിടുത്തത്തിന്റെ പ്രത്യാഘാതങ്ങൾ
സ്റ്റാൻഫോർഡിലെ ഒരു പരിപാടിയിൽ സംസാരിക്കവെ, സ്കെയിലിംഗിനെ അനുകൂലിക്കുന്നവരും സംശയിക്കുന്നവരും തമ്മിലുള്ള തർക്കത്തെക്കുറിച്ച് ആൾട്ട്മാൻ പരാമർശിച്ചു. LLM-കളെ ഒരു "അവസാന വഴി" (dead end) എന്ന് വിശേഷിപ്പിച്ച മെറ്റയുടെ യാൻ ലെക്യൂൺ (Yann LeCun) പോലുള്ള വിമർശകരെ അദ്ദേഹം പ്രത്യേകം ചൂണ്ടിക്കാട്ടി. AI-ക്ക് എന്ത് ചെയ്യാൻ കഴിയില്ല എന്നതിനെക്കുറിച്ചുള്ള ഗവേഷകരുടെ അമിതമായ ആത്മവിശ്വാസമാണ് സ്കെയിലിംഗ് സിദ്ധാന്തത്തോടുള്ള എതിർപ്പിന് പ്രധാന കാരണം എന്ന് ആൾട്ട്മാൻ സൂചിപ്പിക്കുന്നു.
ചില വ്യവസായ പ്രമുഖർ തങ്ങളുടെ തൊഴിൽപരമായ വ്യക്തിത്വത്തെ ചില പ്രത്യേക സിദ്ധാന്തങ്ങളുമായി ബന്ധിപ്പിച്ചിരിക്കുന്നതിനാൽ, തങ്ങളുടെ പഴയ വിശ്വാസങ്ങൾക്ക് വിരുദ്ധമായ പുതിയ വിവരങ്ങളെ സ്വീകരിക്കാൻ അവർ വിമുഖത കാണിക്കുന്നുവെന്ന് അദ്ദേഹം വാദിച്ചു. റോബോട്ടിക്സ് പോലുള്ള മേഖലകളിലെ പുരോഗതിക്ക് "വേൾഡ് മോഡലുകൾ" (world models) അത്യാവശ്യമാണെന്ന് സമ്മതിക്കുമ്പോഴും, LLM-കളുടെ നിലവിലെ പാത ഒരു വഴിതിരിവല്ലെന്നും മറിച്ച് ബുദ്ധിശക്തിയുടെ പ്രധാന ചാലകശക്തിയാണെന്നും ആൾട്ട്മാൻ നിലപാടെടുക്കുന്നു.
അനുഭവസിദ്ധമായ തെളിവുകൾ: പാറ്റേൺ മാച്ചിംഗിന് അപ്പുറത്തേക്ക്
സ്കെയിലിംഗിനെതിരെയുള്ള ആൾട്ട്മാന്റെ വാദങ്ങളിലെ ഏറ്റവും പ്രധാനപ്പെട്ട ഒരു പോയിന്റ്, LLM-കൾ വെറും ടെക്സ്റ്റ് പ്രെഡിക്റ്ററുകളിൽ (text predictors) നിന്ന് സ്വതന്ത്രമായ യുക്തിചിന്ത നടത്താൻ ശേഷിയുള്ള ഉപകരണങ്ങളായി മാറുന്നു എന്നതാണ്. മനുഷ്യരായ വിദഗ്ധർക്ക് ദീർഘകാലമായി പരിഹരിക്കാൻ കഴിയാതിരുന്ന ഒരു ഗണിതശാസ്ത്ര അനുമാനം (mathematical conjecture) ഒരു OpenAI മോഡൽ വിജയകരമായി തെറ്റാണെന്ന് തെളിയിച്ച സമീപകാല നേട്ടത്തെ അദ്ദേഹം ഉദാഹരണമായി ചൂണ്ടിക്കാട്ടി.
LLM-കൾ യഥാർത്ഥമായ കണ്ടെത്തലുകൾ നടത്താൻ ശേഷിയില്ലാത്ത വെറും "സ്റ്റോക്കാസ്റ്റിക് പാരറ്റ്സ്" (stochastic parrots) ആണെന്ന വാദത്തെ ഈ വികാസം വെല്ലുവിളിക്കുന്നു. "അതുകൊണ്ട് തന്നെ, പുതിയ അറിവുകൾ കണ്ടെത്താൻ LLM-കൾക്ക് സാധിക്കുമെന്ന് വ്യക്തമാണ്," എന്ന് ആൾട്ട്മാൻ പ്രസ്താവിച്ചു. AI അടിസ്ഥാനമാക്കിയുള്ള തെളിവുകളുടെ പ്രത്യാഘാതങ്ങളെക്കുറിച്ച് ഗണിതശാസ്ത്ര സമൂഹം ഇപ്പോൾ സജീവമായി ചർച്ച ചെയ്യുന്നുണ്ടെന്നും അദ്ദേഹം കൂട്ടിച്ചേർത്തു. സ്കെയിലിംഗ് എന്നത് ഭാഷാപരമായ ഒഴുക്ക് വർദ്ധിപ്പിക്കുക മാത്രമല്ല, മറിച്ച് വൈജ്ഞാനിക ശേഷിയുടെ പരിധി വിപുലീകരിക്കുകയും ചെയ്യുന്നു എന്നാണ് ഈ മാറ്റം സൂചിപ്പിക്കുന്നത്.
പുതിയ അതിർത്തികൾ: യുക്തിചിന്തയും ദീർഘകാല ലക്ഷ്യങ്ങളും
തന്റെ ശുഭാപ്തിവിശ്വാസത്തിനിടയിലും, സാങ്കേതികവിദ്യയുടെ നിലവിലെ പരിമിതികളെക്കുറിച്ച് ആൾട്ട്മാൻ യാഥാർത്ഥ്യബോധത്തോടെ നിലകൊള്ളുന്നു. "ലോംഗ്-ഹൊറൈസൺ ടാസ്ക്കുകൾ" (long-horizon tasks)—അതായത് ദീർഘനേരം ഉയർന്ന നിലവാരത്തിലുള്ള വിവേചനവും പല ഘട്ടങ്ങളിലായുള്ള ആസൂത്രണവും ആവശ്യമായ സങ്കീർണ്ണമായ പ്രവർത്തനങ്ങൾ—കൈകാര്യം ചെയ്യുന്നതിൽ വ്യക്തമായ പ്രകടന വ്യത്യാസമുണ്ടെന്ന് അദ്ദേഹം നിരീക്ഷിച്ചു. ഈ പ്രത്യേക മേഖലകളിൽ LLM-കൾ ഇപ്പോഴും "മനുഷ്യരേക്കാൾ വളരെ പിന്നിലാണെന്ന്" അദ്ദേഹം സമ്മതിച്ചു.
AI രംഗത്തെ വിശാലമായ കാഴ്ചപ്പാടിൽ, ഈ വ്യത്യാസം ഗവേഷണത്തിന്റെ അടുത്ത ഘട്ടത്തെ നിർവചിക്കുന്നു. വ്യവസായം "അറിവിനായുള്ള സ്കെയിലിംഗിൽ" (scaling for knowledge) നിന്ന് "യുക്തിചിന്തയ്ക്കും ഏജൻസിക്കുമുള്ള സ്കെയിലിംഗിലേക്ക്" (scaling for reasoning and agency) മാറിക്കൊണ്ടിരിക്കുകയാണ്. OpenAI, Anthropic (സിഇഒ ഡാറിയോ അമോഡിയുടെ നേതൃത്വത്തിൽ, ഇദ്ദേഹവും ആൾട്ട്മാനെപ്പോലെ സ്കെയിലിംഗിൽ വിശ്വസിക്കുന്നു) തുടങ്ങിയ കമ്പനികൾ കമ്പ്യൂട്ടിംഗിനായി കോടിക്കണക്കിന് ഡോളറുകൾ ചെലവഴിക്കുമ്പോൾ, താൽക്കാലികമായ ബുദ്ധിശക്തിയും വിശ്വസനീയമായ ദീർഘകാല സ്വയംഭരണാധികാരവും (autonomy) തമ്മിലുള്ള വിടവ് നികത്തുക എന്നതാണ് ലക്ഷ്യം.
പ്രധാന കാര്യങ്ങൾ
- സ്കെയിലിംഗ് ആണ് പ്രധാന ചാലകശക്തി: കമ്പ്യൂട്ട്, ഡാറ്റ എന്നിവയുടെ വർദ്ധനവ് നൽകുന്ന സ്വാധീനത്തെ കുറച്ചുകാണിച്ചത് ചരിത്രപരമായി AI മുന്നേറ്റങ്ങളുടെ വേഗത കുറച്ചുവെന്ന് ആൾട്ട്മാൻ വാദിക്കുന്നു.
- അനുകരണത്തേക്കാൾ കണ്ടെത്തലുകൾക്ക് മുൻഗണന: സങ്കീർണ്ണമായ ഗണിതശാസ്ത്ര അനുമാനങ്ങൾ പരിഹരിക്കാനുള്ള OpenAI മോഡലുകളുടെ കഴിവ്, LLM-കൾ യഥാർത്ഥ അറിവ് സൃഷ്ടിക്കുന്നതിലേക്ക് നീങ്ങുന്നുവെന്ന് തെളിയിക്കുന്നു.
- അടുത്ത തടസ്സം: സ്കെയിലിംഗ് പല പ്രശ്നങ്ങളും പരിഹരിക്കുമെങ്കിലും, ദീർഘകാല ലക്ഷ്യങ്ങളുള്ളതും ഉയർന്ന വിവേചനം ആവശ്യമായതുമായ ജോലികളിൽ മനുഷ്യതലത്തിലുള്ള പ്രകടനം കൈവരിക്കുക എന്നത് വ്യവസായത്തിന്റെ അടുത്ത വലിയ വെല്ലുവിളിയായി തുടരുന്നു.