માર્ગારેટ એટવુડની ચેતવણી: AI હજુ પણ "Garbage In, Garbage Out" માં કેમ અટવાયેલું છે

પ્રખ્યાત લેખિકા માર્ગારેટ એટવુડે તાજેતરમાં લાર્જ લેંગ્વેજ મોડલ્સ (LLMs) ની આકરી ટીકા કરી છે, જેમાં સચોટતા અને ડેટાની અખંડિતતા સાથેના સતત સંઘર્ષ પર પ્રકાશ પાડવામાં આવ્યો છે. તેમનો અનુભવ વર્તમાન AI યુગના એક મૂળભૂત સત્ય પર ભાર મૂકે છે: અત્યંત અદ્યતન મોડલ્સ પણ તેમના તાલીમ ડેટા (training data) ની ગુણવત્તા દ્વારા મર્યાદિત હોય છે.

Claude નો પ્રયોગ: Hallucinations માંથી મળતો પાઠ

પોર્ટુગલના પોર્ટોમાં બાબેલ લિટરેરી એન્ડ કલ્ચરલ ફેસ્ટિવલમાં બોલતા, Handmaid’s Tale ના લેખિકાએ Anthropic ના Claude નો ઉપયોગ કરવાનો પોતાનો એક અનુભવ શેર કર્યો હતો. બ્રિટિશ ડિટેક્ટિવ સિરીઝ Father Brown વિશે માહિતી મેળવવા માટે ચેટબોટનો ઉપયોગ કરવાનો એટવુડનો પ્રયાસ નિષ્ફળ રહ્યો હતો, જે "hallucination" ના ખ્યાલને સંપૂર્ણ રીતે સમજાવે છે.

એટવુડના જણાવ્યા અનુસાર, મોડલે ખોટી માહિતી આપી હતી, જે અસરકારક રીતે વપરાશકર્તા સાથે "જૂઠું" બોલવા સમાન હતું. તેમણે નોંધ્યું કે LLM એ સંભવતઃ ટેલિવિઝન રિવ્યુઝના વિશાળ જથ્થાને ઝડપથી વાંચ્યો અને તેમાંથી નમૂના લીધા હશે, પરંતુ ઓનલાઇન ટીકા સામાન્ય રીતે 'સ્પૉઇલર્સ' (spoilers) ટાળતી હોવાથી, મોડલ તેના ટ્રેનિંગ સેટમાં રહેલા પેટર્ન દ્વારા ગેરમાર્ગે દોરાયું હતું. આ તકનીકી સૂક્ષ્મતા ડેવલપર્સ માટે એક મુખ્ય પડકાર દર્શાવે છે: LLMs એ સંભવિતતા આધારિત (probabilistic) એન્જિન છે જે તથ્યપૂર્ણ ચકાસણી કરતાં પેટર્ન મેચિંગને પ્રાધાન્ય આપે છે, જે ઘણીવાર આત્મવિશ્વાસપૂર્ણ છતાં ભૂલભરેલા પરિણામો તરફ દોરી જાય છે.

ડેટાની દ્વિધા: Garbage In, Garbage Out

એટવુડની ટીકા કમ્પ્યુટિંગના એક શાશ્વત સિદ્ધાંત પર કેન્દ્રિત છે: "garbage in, garbage out." તેમણે ધ્યાન દોર્યું કે LLMs ને સ્ક્રેપ કરેલી, અગાઉ પ્રકાશિત થયેલી અને સંભવતઃ જૂની માહિતી પર તાલીમ આપવામાં આવે છે. જ્યારે મોડલને અધૂરી, પક્ષપાતી અથવા તાર્કિક રીતે અસંગત ડેટા આપવામાં આવે છે, ત્યારે તેનું પરિણામ અનિવાર્યપણે તે ખામીઓને પ્રતિબિંબિત કરશે.

વ્યાપક AI ક્ષેત્ર માટે, આ એક સ્મૃતિપત્ર તરીકે કામ કરે છે કે મોડલ પેરામીટર્સનું સ્કેલિંગ કરવું એ ડેટાની ગુણવત્તાનો વિકલ્પ નથી. જેમ જેમ ડેવલપર્સ તર્ક કરવાની ક્ષમતા વધારવા માટે મોટા ડેટાસેટ્સ તરફ આગળ વધી રહ્યા છે, તેમ તેમ તે ડેટાસેટ્સમાં રહેલો "નોઈઝ" (noise)—જેમ કે એટવુડ દ્વારા ઉલ્લેખિત રિવ્યુઝમાં પ્લોટ સ્પૉઇલર્સનો અભાવ—એવા પદ્ધતિસરના એરર (systematic errors) પેદા કરી શકે છે જેને Claude જેવી અત્યાધુનિક આર્કિટેક્ચર પણ સરળતાથી દૂર કરી શકતી નથી.

નૈતિક ચિંતા: તકવાદ વિરુદ્ધ સર્જનાત્મકતા

તકનીકી મર્યાદાઓ ઉપરાંત, એટવુડે AI અપનાવવામાં માનવીય તત્વ વિશે વાત કરી. તેમણે જેઓ AI પર વધુ પડતો આધાર રાખે છે તેમને "તકવાદીઓ" (opportunists) તરીકે ઓળખાવ્યા, જેઓ વાસ્તવિક સર્જન અથવા સંશોધનની કઠિનતાને ટાળવા માટે સરળ રસ્તો શોધી રહ્યા છે. તેમણે ચેતવણી આપી હતી કે અદ્રશ્ય AI-જનરેટેડ કન્ટેન્ટનો ઉપયોગ કરીને "છેતરપિંડી" કરવાની લાલચ એ માનવ બુદ્ધિ અને સૂક્ષ્મતા પર નિર્ભર ઉદ્યોગો માટે વધતી જતી ચિંતા છે.

સ્થાપકો (founders) અને ટેક પ્રોફેશનલ્સ માટે, આ તફાવત મહત્વપૂર્ણ છે. જોકે AI એક શક્તિશાળી ઉત્પાદકતા સાધન તરીકે કામ કરી શકે છે, પરંતુ એટવુડનું અવલોકન કે "જે લોકો તેનો ઉપયોગ વ્યવસાયિક કારણોસર કરે છે તેમણે પણ તેને તપાસવું પડે છે" એ વાત પર ભાર મૂકે છે કે માનવીય દેખરેખ (human oversight) એ AI વર્કફ્લોનો એક અનિવાર્ય ઘટક છે. સંપૂર્ણ સ્વાયત્ત, ભૂલરહિત AI નો યુગ હજુ પણ દૂરનો વિચાર છે, અને સત્યની જવાબદારી વપરાશકર્તાની જ રહે છે.

મુખ્ય મુદ્દાઓ

  • ડેટાની અખંડિતતા સર્વોપરી છે: "garbage in, garbage out" નો સિદ્ધાંત LLMs માટે સૌથી મોટો અવરોધ છે, કારણ કે મોડલ્સ તેમના તાલીમ ડેટાની ગુણવત્તા અને સંપૂર્ણતા દ્વારા મર્યાદિત હોય છે.
  • Hallucination નો ફાંસો: Anthropic ના Claude જેવા અદ્યતન મોડલ્સ પણ સાદા તથ્યપૂર્ણ ડેટા મેળવવામાં નિષ્ફળ જઈ શકે છે જો તેમના તાલીમ ડેટામાં રહેલી પેટર્ન ગેરમાર્ગે દોરનારી હોય.
  • માનવીય દેખરેખની આવશ્યકતા: AI ને માનવ નિપુણતા અને વિવેચનાત્મક વિચારસરણીના વિકલ્પ તરીકે નહીં, પરંતુ સતત ચકાસણીની જરૂર હોય તેવા સાધન તરીકે જોવું જોઈએ.