In the Weights: નવું સાધન AI મોડલ્સમાં તમારી ડિજિટલ હાજરી પ્રગટ કરે છે

શું તમે ક્યારેય વિચાર્યું છે કે તમારી વ્યક્તિગત ઓળખ વિશ્વના સૌથી શક્તિશાળી AI ના ન્યુરલ નેટવર્ક્સમાં કોતરાયેલી છે? "In the Weights" નામનું એક નવું પ્લેટફોર્મ હવે Large Language Models (LLMs) માં ચોક્કસ વ્યક્તિઓ કેટલી ઊંડે સુધી સમાવિષ્ટ છે તેનું માપન કરીને તે પ્રશ્નનો સંખ્યાત્મક જવાબ આપી રહ્યું છે.

જ્ઞાનના "weights" ને ડિકોડ કરવું

Large Language Models પરંપરાગત ડેટાબેઝની જેમ કામ કરતા નથી; તેઓ "weights" તરીકે ઓળખાતી અબજો સંખ્યાત્મક કિંમતો દ્વારા માહિતી સંગ્રહિત કરે છે. આ weights એ પેટર્ન અને તથ્યોને એન્કોડ કરે છે જે મોડેલે તેના વિશાળ તાલીમ તબક્કા દરમિયાન શીખ્યા હોય છે. જ્યારે કોઈ વ્યક્તિ આ weights માં દેખાય છે, ત્યારે તેનો અર્થ એ છે કે મોડેલ તેમને એટલા સુસંગત માને છે કે તે રીઅલ-ટાઇમ વેબ સર્ચ કરવાની અથવા RAG (Retrieval-Augmented Generation) સાધનોનો ઉપયોગ કરવાની જરૂર વગર તેમની વિશેની માહિતી આપમેળે યાદ કરી શકે છે.

OpenAI ના ભૂતપૂર્વ કર્મચારીઓ Joey Flynn અને Thomas Dimson દ્વારા વિકસિત, "In the Weights" વિવિધ મોડેલ્સને પદ્ધતિસર રીતે ક્વેરી કરે છે જેથી તે ઓળખી શકાય કે કોઈ ચોક્કસ નામ સુસંગત જીવનચરિત્રાત્મક પ્રતિસાદ આપે છે કે નહીં. ત્યારબાદ આ પ્લેટફોર્મ વ્યક્તિને "strength score" આપવા માટે આ તારણોને એકત્રિત કરે છે, જે અસરકારક રીતે આર્ટિફિશિયલ ઇન્ટેલિજન્સના latent space માં તેમની પ્રસિદ્ધિના સ્તરનું મેપિંગ કરે છે.

Strength Scores દ્વારા પ્રસિદ્ધિનું માપન

પ્લેટફોર્મ સામાન્ય ઉલ્લેખ અને તાલીમ ડેટાના મુખ્ય ભાગ વચ્ચે તફાવત કરવા માટે એક અત્યાધુનિક સ્કોરિંગ સિસ્ટમનો ઉપયોગ કરે છે. સંદર્ભ આપવા માટે, નિર્માતાઓએ સુસંગતતાનું એક સ્પેક્ટ્રમ સ્થાપિત કર્યું છે:

  • ઓછી સ્તરની હાજરી: મોટાભાગની ખાનગી વ્યક્તિઓ માટે સ્કોર ઓછો હશે.
  • ઉચ્ચ સ્તરની હાજરી: Meta ના 1 બિલિયન પેરામીટર્સ ધરાવતા Llama જેવા નાના મોડેલ્સમાં પણ દેખાવું એ ઉચ્ચ સુસંગતતા સૂચવે છે.
  • મહત્તમ સુસંગતતા: 996 નો મહત્તમ strength score Mozart, William Shakespeare અથવા Taylor Swift જેવા વૈશ્વિક આઇકોન્સ માટે અનામત છે.

અનેક મોડેલ્સનું પરીક્ષણ કરીને અને પરિણામોને જોડીને, આ સાધન એક એવું માપદંડ પૂરું પાડે છે જે માત્ર "હા કે ના" ના જવાબોથી આગળ વધીને, AI ઇકોસિસ્ટમમાં વ્યક્તિ કેટલું "weight" ધરાવે છે તેનો સૂક્ષ્મ દૃષ્ટિકોણ આપે છે.

મર્યાદાઓ અને Hallucination નું પડકાર

જોકે આ સાધન AI મેમરીની એક રસપ્રદ ઝલક આપે છે, તેના નિર્માતાઓ LLMs ની આંતરિક તકનીકી મુશ્કેલીઓને ઉજાગર કરવામાં તત્પર છે. મુખ્ય જોખમોમાંનું એક hallucination છે, જ્યાં મોડેલ અસ્તિત્વમાં ન હોય તેવી વ્યક્તિ વિશે આત્મવિશ્વાસ સાથે જીવનચરિત્રાત્મક વિગતો બનાવી શકે છે અથવા તથ્યોને ખોટી રીતે જોડી શકે છે.

વધુમાં, સ્ટ્રેન્થ સ્કોરની ચોકસાઈ ઇનપુટની ગુણવત્તા પર આધારિત છે; સામાન્ય ટાઈપો સ્કોરને નોંધપાત્ર રીતે ઘટાડી શકે છે, અને સામાન્ય નામો ઘણીવાર અસ્પષ્ટ પરિણામો આપે છે કારણ કે મોડેલ સમાન નામ ધરાવતી વિવિધ વ્યક્તિઓ વચ્ચે તફાવત કરવામાં સંઘર્ષ કરે છે. આ वस्तुનિષ્ઠ જીવનચરિત્રાત્મક તથ્યોને માપવા માટે સંભવિત (probabilistic) મોડેલોનો ઉપયોગ કરવાની જટિલતા પર ભાર મૂકે છે.

AI લેન્ડસ્કેપ માટે આ શા માટે મહત્વનું છે

જેમ જેમ AI મોડેલ્સ માહિતી મેળવવા માટેનું મુખ્ય ઇન્ટરફેસ બની રહ્યા છે, તેમ તેઓ ડિફોલ્ટ રીતે શું "જાણે" છે તે સમજવું અત્યંત મહત્વનું છે. ડેવલપર્સ અને સંશોધકો માટે, "In the Weights" મોડેલ સ્કેલ અને ડેટા ડેન્સિટી વચ્ચેના તણાવને પ્રકાશિત કરે છે. તે ગોપનીયતા અને "ભૂલી જવાનો અધિકાર" (right to be forgotten) અંગે પણ મહત્વપૂર્ણ પ્રશ્નો ઉભા કરે છે, એક એવા યુગમાં જ્યાં આપણી ડિજિટલ ઓળખ પ્રોપ્રાઇટરી મોડેલ્સના કાયમી સંખ્યાત્મક વજન (numerical weights) માં સમાઈ રહી છે.

મુખ્ય મુદ્દાઓ

  • AI મેમરીનું પ્રમાણીકરણ: "In the Weights" વ્યક્તિની ઓળખ મોડેલના વજનમાં કેટલી ઊંડે સુધી એન્કોડ થયેલી છે તે માપવા માટે સ્ટ્રેન્થ સ્કોર (996 સુધી) નો ઉપયોગ કરે છે.
  • પ્રસ્તુતતા બેન્ચમાર્ક: Meta ના Llama જેવા નાના, પેરામીટર-કાર્યક્ષમ મોડેલ્સમાં દેખાવું એ મોડેલના તાલીમ ડેટા સાથે ઉચ્ચ સ્તરની પ્રસ્તુતતા સૂચવે છે.
  • તકનીકી મર્યાદાઓ: આ સાધનને hallucination, નામની અસ્પષ્ટતા અને ટાઈપોગ્રાફિકલ ભૂલો પ્રત્યેની સંવેદનશીલતા સહિતની સામાન્ય LLM મુશ્કેલીઓનો સામનો કરવો પડે છે.