മാർഗരറ്റ് ആറ്റ്വുഡ് മുന്നറിയിപ്പ് നൽകുന്നു: എന്തുകൊണ്ടാണ് AI ഇപ്പോഴും "Garbage In, Garbage Out" എന്ന അവസ്ഥയിൽ കുടുങ്ങിക്കിടക്കുന്നത്
പ്രശസ്ത എഴുത്തുകാരിയായ മാർഗരറ്റ് ആറ്റ്വുഡ് അടുത്തിടെ ലാർജ് ലാംഗ്വേജ് മോഡലുകളെ (LLMs) രൂക്ഷമായി വിമർശിച്ചു. കൃത്യതയുടെയും ഡാറ്റാ വിശ്വാസ്യതയുടെയും കാര്യത്തിലുള്ള നിരന്തരമായ പോരാട്ടങ്ങളെക്കുറിച്ചാണ് അവർ ചൂണ്ടിക്കാട്ടിയത്. നിലവിലെ AI യുഗത്തിലെ ഒരു അടിസ്ഥാന സത്യത്തെ അവരുടെ അനുഭവം അടിവരയിടുന്നു: ഏറ്റവും നൂതനമായ മോഡലുകൾ പോലും അവയുടെ പരിശീലന ഡാറ്റയുടെ (training data) ഗുണനിലവാരത്താൽ പരിമിതമാണ്.
Claude പരീക്ഷണം: ഹാലൂസിനേഷനുകളിൽ നിന്നുള്ള ഒരു പാഠം
പോർച്ചുഗലിലെ പോർട്ടോയിൽ നടന്ന ബാബൽ സാഹിത്യ-സാംസ്കാരിക ഫെസ്റ്റിവലിൽ സംസാരിക്കവെ, Handmaid’s Tale-ന്റെ രചയിതാവ് Anthropic-ന്റെ Claude ഉപയോഗിച്ച തന്റെ അനുഭവം പങ്കുവെച്ചു. ബ്രിട്ടീഷ് ഡിറ്റക്റ്റീവ് പരമ്പരയായ Father Brown-നെ കുറിച്ചുള്ള വിവരങ്ങൾ അറിയാൻ ചാറ്റ്ബോട്ട് ഉപയോഗിക്കാൻ ആറ്റ്വുഡ് നടത്തിയ ശ്രമം പരാജയപ്പെട്ടു. ഇത് "ഹാലൂസിനേഷൻ" (hallucination) എന്ന സങ്കൽപ്പത്തെ കൃത്യമായി വ്യക്തമാക്കുന്നു.
ആറ്റ്വുഡിന്റെ അഭിപ്രായത്തിൽ, മോഡൽ തെറ്റായ വിവരങ്ങൾ നൽകുകയും യഥാർത്ഥത്തിൽ ഉപയോക്താവിനോട് "നുണ പറയുകയും" ചെയ്തു. ടിവി റിവ്യൂകളിൽ നിന്ന് വിവരങ്ങൾ ശേഖരിക്കാൻ LLM ശ്രമിച്ചിട്ടുണ്ടാകുമെന്നും എന്നാൽ ഓൺലൈൻ നിരൂപണങ്ങളിൽ സാധാരണയായി കഥാസംഗ്രഹങ്ങൾ (spoilers) ഒഴിവാക്കുന്നതിനാൽ, പരിശീലന ഡാറ്റയിലെ പാറ്റേണുകൾ മോഡലിനെ തെറ്റായ വഴിയിലേക്ക് നയിച്ചതായും അവർ നിരീക്ഷിച്ചു. ഈ സാങ്കേതിക വശം ഡെവലപ്പർമാർ നേരിടുന്ന ഒരു പ്രധാന വെല്ലുവിളിയെ ചൂണ്ടിക്കാട്ടുന്നു: LLM-കൾ വസ്തുതാപരമായ പരിശോധനയേക്കാൾ പാറ്റേൺ മാച്ചിംഗിന് മുൻഗണന നൽകുന്ന പ്രോബബിലിസ്റ്റിക് എൻജിനുകളാണ്, ഇത് പലപ്പോഴും ആത്മവിശ്വാസത്തോടെ തെറ്റായ വിവരങ്ങൾ നൽകാൻ കാരണമാകുന്നു.
ഡാറ്റാ പ്രതിസന്ധി: Garbage In, Garbage Out
ആറ്റ്വുഡിന്റെ വിമർശനം കമ്പ്യൂട്ടിംഗിലെ കാലാതീതമായ ഒരു തത്വത്തിലാണ് കേന്ദ്രീകരിച്ചിരിക്കുന്നത്: "garbage in, garbage out". ഇന്റർനെറ്റിൽ നിന്ന് ശേഖരിച്ചതും, നേരത്തെ പ്രസിദ്ധീകരിച്ചതും, കാലഹരണപ്പെട്ടതാകാൻ സാധ്യതയുള്ളതുമായ വിവരങ്ങൾ ഉപയോഗിച്ചാണ് LLM-കൾ പരിശീലിപ്പിക്കുന്നത് എന്ന് അവർ ചൂണ്ടിക്കാട്ടി. അപൂർണ്ണമോ, പക്ഷപാതപരമോ, യുക്തിരഹിതമോ ആയ ഡാറ്റ ഒരു മോഡലിലേക്ക് നൽകപ്പെട്ടാൽ, അതിന്റെ ഫലമായി ലഭിക്കുന്ന വിവരങ്ങളിലും ആ പോരായ്മകൾ അനിവാര്യമായും പ്രതിഫലിക്കും.
വിശാലമായ AI മേഖലയെ സംബന്ധിച്ചിടത്തോളം, മോഡൽ പാരാമീറ്ററുകൾ വർദ്ധിപ്പിക്കുന്നത് ഡാറ്റയുടെ ഗുണനിലവാരത്തിന് പകരമാവില്ല എന്ന ഓർമ്മപ്പെടുത്തലാണിത്. ഡെവലപ്പർമാർ ചിന്താശേഷി വർദ്ധിപ്പിക്കുന്നതിനായി വലിയ ഡാറ്റാസെറ്റുകൾ ഉപയോഗിക്കുമ്പോൾ, ആ ഡാറ്റാസെറ്റുകൾക്കുള്ളിലെ "noise" (ആറ്റ്വുഡ് സൂചിപ്പിച്ചതുപോലെ റിവ്യൂകളിൽ കഥാസംഗ്രഹങ്ങൾ ഇല്ലാത്തത് പോലുള്ള കാര്യങ്ങൾ)—Claude പോലുള്ള അത്യാധുനിക സംവിധാനങ്ങൾക്ക് പോലും മറികടക്കാൻ കഴിയാത്ത വ്യവസ്ഥാപിത പിശകുകൾ സൃഷ്ടിച്ചേക്കാം.
ധാർമ്മികമായ ആശങ്ക: അവസരവാദവും സർഗ്ഗാത്മകതയും
സാങ്കേതിക പരിമിതികൾക്കപ്പുറം, AI ഉപയോഗിക്കുന്നതിലെ മാനുഷിക വശത്തെക്കുറിച്ചും ആറ്റ്വുഡ് സംസാരിച്ചു. യഥാർത്ഥ സർഗ്ഗാത്മകതയോ ഗവേഷണമോ ഒഴിവാക്കി എളുപ്പവഴികൾ തേടുന്നവരെ അവർ "അവസരവാദികൾ" എന്ന് വിളിച്ചു. കണ്ടെത്താൻ കഴിയാത്ത രീതിയിലുള്ള AI-ജനറേറ്റഡ് ഉള്ളടക്കം ഉപയോഗിച്ച് "ചതിക്കാൻ" ശ്രമിക്കുന്നത് മനുഷ്യബുദ്ധിയെയും സൂക്ഷ്മതയെയും ആശ്രയിക്കുന്ന വ്യവസായങ്ങളെ സംബന്ധിച്ചിടത്തോളം വളർന്നുവരുന്ന ആശങ്കയാണെന്ന് അവർ മുന്നറിയിപ്പ് നൽകി.
സ്ഥാപകർക്കും സാങ്കേതിക വിദഗ്ധർക്കും ഈ വ്യത്യാസം വളരെ പ്രധാനമാണ്. AI ഒരു ശക്തമായ ഉൽപ്പാദനക്ഷമതാ ഉപകരണം (productivity tool) ആയി പ്രവർത്തിക്കുമെങ്കിലും, "ബിസിനസ് ആവശ്യങ്ങൾക്കായി ഉപയോഗിക്കുന്നവർ പോലും അത് പരിശോധിക്കേണ്ടതുണ്ട്" എന്ന ആറ്റ്വുഡിന്റെ നിരീക്ഷണം, AI പ്രവർത്തനങ്ങളിൽ മനുഷ്യന്റെ മേൽനോട്ടം അനിവാര്യമാണെന്ന് ഊന്നിപ്പറയുന്നു. പൂർണ്ണമായും സ്വയംഭരണാധികാരമുള്ളതും പിശകുകളില്ലാത്തതുമായ AI കാലഘട്ടം ഇപ്പോഴും വിദൂരമാണ്, സത്യം ഉറപ്പുവരുത്തേണ്ട ഉത്തരവാദിത്തം ഉപയോക്താവിനാണ്.
പ്രധാന കാര്യങ്ങൾ
- ഡാറ്റാ വിശ്വാസ്യത അത്യന്താപേക്ഷിതമാണ്: പരിശീലന ഡാറ്റയുടെ ഗുണനിലവാരവും പൂർണ്ണതയും മോഡലുകളെ പരിമിതപ്പെടുത്തുന്നതിനാൽ, "garbage in, garbage out" എന്ന തത്വം LLM-കൾ നേരിടുന്ന ഏറ്റവും വലിയ തടസ്സമായി തുടരുന്നു.
- ഹാലൂസിനേഷൻ കെണി: പരിശീലന ഡാറ്റയിലെ പാറ്റേണുകൾ തെറ്റാണെങ്കിൽ, Anthropic-ന്റെ Claude പോലുള്ള അത്യാധുനിക മോഡലുകൾക്ക് പോലും ലളിതമായ വസ്തുതകൾ നൽകുന്നതിൽ പരാജയപ്പെടാം.
- മനുഷ്യ മേൽനോട്ടത്തിന്റെ ആവശ്യകത: AI-യെ മനുഷ്യന്റെ വൈദഗ്ധ്യത്തിനും വിമർശനാത്മക ചിന്തയ്ക്കും പകരമായി കാണുന്നതിന് പകരം, നിരന്തരമായ പരിശോധന ആവശ്യമായ ഒരു ഉപകരണം എന്ന നിലയിൽ കാണണം.
