In the Weights: New Tool Reveals Your Digital Presence in AI Models

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial2 ആഴ്ച മുമ്പ്3min read

In this article

In the Weights: AI മോഡലുകളിലെ നിങ്ങളുടെ ഡിജിറ്റൽ സാന്നിധ്യം വെളിപ്പെടുത്തുന്ന പുതിയ ടൂൾ

ലോകത്തിലെ ഏറ്റവും ശക്തമായ AI-യുടെ ന്യൂറൽ നെറ്റ്‌വർക്കുകളിൽ നിങ്ങളുടെ വ്യക്തിത്വം പതിഞ്ഞിട്ടുണ്ടോ എന്ന് നിങ്ങൾ എപ്പോഴെങ്കിലും ചിന്തിച്ചിട്ടുണ്ടോ? "In the Weights" എന്ന പുതിയ പ്ലാറ്റ്‌ഫോം, വ്യക്തികൾ Large Language Models (LLMs)-ൽ എത്രത്തോളം ആഴത്തിൽ ഉൾച്ചേർന്നിരിക്കുന്നു എന്ന് അളക്കുന്നതിലൂടെ ആ ചോദ്യത്തിന് കൃത്യമായ ഒരു ഉത്തരം നൽകുന്നു.

അറിവിന്റെ "Weights" വിശകലനം ചെയ്യുന്നു

Large Language Models പരമ്പരാഗത ഡാറ്റാബേസുകളെപ്പോലെയല്ല പ്രവർത്തിക്കുന്നത്; അവ "weights" എന്ന് വിളിക്കപ്പെടുന്ന കോടിക്കണക്കിന് സംഖ്യാ മൂല്യങ്ങളിലൂടെയാണ് വിവരങ്ങൾ സംഭരിക്കുന്നത്. മോഡൽ അതിന്റെ വിപുലമായ പരിശീലന ഘട്ടത്തിൽ പഠിച്ച പാറ്റേണുകളും വസ്തുതകളും ഈ weights-ൽ ഉൾക്കൊള്ളുന്നു. ഒരു വ്യക്തി ഈ weights-ൽ പ്രത്യക്ഷപ്പെടുന്നുണ്ടെങ്കിൽ, അതിനർത്ഥം ആ വ്യക്തിയെക്കുറിച്ചുള്ള വിവരങ്ങൾ തത്സമയ വെബ് സെർച്ച് നടത്തുകയോ RAG (Retrieval-Augmented Generation) ടൂളുകൾ ഉപയോഗിക്കുകയോ ചെയ്യാതെ തന്നെ, മോഡലിന് സ്വമേധയാ ഓർത്തെടുക്കാൻ കഴിയുന്നത്ര പ്രസക്തമാണെന്നാണ്.

മുൻ OpenAI ജീവനക്കാരായ ജോയി ഫ്ലിൻ (Joey Flynn), തോമസ് ഡിംസൺ (Thomas Dimson) എന്നിവർ വികസിപ്പിച്ചെടുത്ത "In the Weights", ഒരു പ്രത്യേക പേര് നൽകിയാൽ വ്യക്തമായ ഒരു ജീവചരിത്രപരമായ മറുപടി ലഭിക്കുമോ എന്ന് വിവിധ മോഡലുകളെ വ്യവസ്ഥാപിതമായി പരിശോധിക്കുന്നു. തുടർന്ന്, ഈ കണ്ടെത്തലുകൾ ക്രോഡീകരിച്ച് ഓരോ വ്യക്തിക്കും ഒരു "strength score" നൽകുന്നതിലൂടെ, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ ലാറ്റന്റ് സ്പേസിലെ (latent space) അവരുടെ പ്രശസ്തിയുടെ അളവ് ഈ പ്ലാറ്റ്‌ഫോം കൃത്യമായി രേഖപ്പെടുത്തുന്നു.

Strength Scores വഴി പ്രശസ്തി അളക്കുന്നു

ഒരു വെറുമൊരു പരാമർശവും പ്രധാനപ്പെട്ട പരിശീലന ഡാറ്റയും തമ്മിലുള്ള വ്യത്യാസം തിരിച്ചറിയാൻ പ്ലാറ്റ്‌ഫോം ഒരു സങ്കീർണ്ണമായ സ്കോറിംഗ് സംവിധാനം ഉപയോഗിക്കുന്നു. ഇതിന്റെ പശ്ചാത്തലം വ്യക്തമാക്കുന്നതിനായി, പ്രസക്തിയുടെ വിവിധ തലങ്ങൾ സ്രഷ്ടാക്കൾ നിശ്ചയിച്ചിട്ടുണ്ട്:

കുറഞ്ഞ സാന്നിധ്യം (Low-level presence): ഭൂരിഭാഗം സാധാരണ വ്യക്തികളും കുറഞ്ഞ സ്കോറുകൾക്ക് കാരണമാകും.
ഉയർന്ന സാന്നിധ്യം (High-level presence): മെറ്റയുടെ (Meta) 1 ബില്യൺ പാരാമീറ്ററുകളുള്ള Llama പോലുള്ള ചെറിയ മോഡലുകളിൽ പോലും പ്രത്യക്ഷപ്പെടുന്നത് ഉയർന്ന പ്രസക്തിയെ സൂചിപ്പിക്കുന്നു.
പരമാവധി പ്രസക്തി (Maximum relevance): മോസാർട്ട്, വില്യം ഷേക്സ്പിയർ അല്ലെങ്കിൽ ടെയ്‌ലർ സ്വിഫ്റ്റ് തുടങ്ങിയ ആഗോള പ്രശസ്തർക്കായി 996 എന്ന പരമാവധി strength score മാറ്റിവെച്ചിരിക്കുന്നു.

ഒന്നിലധികം മോഡലുകൾ പരീക്ഷിക്കുകയും അവയുടെ ഫലങ്ങൾ സംയോജിപ്പിക്കുകയും ചെയ്യുന്നതിലൂടെ, വെറുമൊരു "അതെ അല്ലെങ്കിൽ അല്ല" എന്ന മറുപടിക്ക് അപ്പുറം, AI ഇക്കോസിസ്റ്റത്തിൽ ഒരു വ്യക്തിക്ക് എത്രത്തോളം "weight" ഉണ്ടെന്നതിനെക്കുറിച്ച് സൂക്ഷ്മമായ ഒരു കാഴ്ചപ്പാട് ഈ ടൂൾ നൽകുന്നു.

പരിമിതികളും ഹാളുസിനേഷനും (Hallucination) നേരിടുന്ന വെല്ലുവിളികളും

ഈ ടൂൾ AI മെമ്മറിയെക്കുറിച്ച് ആകർഷകമായ ഒരു കാഴ്ചപ്പാട് നൽകുന്നുണ്ടെങ്കിലും, LLM-കളുടെ സ്വാഭാവികമായ സാങ്കേതിക തടസ്സങ്ങളെക്കുറിച്ച് ഇതിന്റെ സ്രഷ്ടാക്കൾ മുന്നറിയിപ്പ് നൽകുന്നുണ്ട്. ഇതിലെ പ്രധാന അപകടങ്ങളിൽ ഒന്നാണ് ഹാലൂസിനേഷൻ (hallucination); അതായത്, നിലവിലില്ലാത്ത ഒരാളെക്കുറിച്ച് ആത്മവിശ്വാസത്തോടെ ജീവിതവിവരങ്ങൾ കെട്ടിച്ചമയ്ക്കുകയോ വസ്തുതകൾ തെറ്റായി നൽകുകയോ ചെയ്യാനുള്ള സാധ്യത.

കൂടാതെ, സ്ട്രെങ്ത് സ്കോറിന്റെ (strength score) കൃത്യത ഇൻപുട്ടിന്റെ ഗുണനിലവാരത്തെ ആശ്രയിച്ചിരിക്കുന്നു; ചെറിയ അക്ഷരത്തെറ്റുകൾ പോലും സ്കോറിനെ ഗണ്യമായി കുറയ്ക്കാൻ കാരണമാകും. അതുപോലെ, ഒരേ പേരുള്ള വ്യത്യസ്ത വ്യക്തികളെ തിരിച്ചറിയാൻ മോഡലിന് പ്രയാസമുള്ളതിനാൽ സാധാരണ പേരുകൾ പലപ്പോഴും വ്യക്തമല്ലാത്ത ഫലങ്ങൾ നൽകുന്നു. വസ്തുനിഷ്ഠമായ ജീവിതവിവരങ്ങൾ അളക്കാൻ പ്രോബബിലിസ്റ്റിക് മോഡലുകൾ ഉപയോഗിക്കുന്നതിലെ സങ്കീർണ്ണതയെയാണ് ഇത് എടുത്തുകാണിക്കുന്നത്.

എന്തുകൊണ്ടാണ് ഇത് AI മേഖലയിൽ പ്രധാനമാകുന്നത്

വിവരശേഖരണത്തിനായുള്ള പ്രധാന മാർഗമായി AI മോഡലുകൾ മാറിക്കൊണ്ടിരിക്കുന്ന സാഹചര്യത്തിൽ, അവയ്ക്ക് സ്വാഭാവികമായി എന്തൊക്കെ അറിയാമെന്ന് മനസ്സിലാക്കുന്നത് നിർണ്ണായകമാണ്. ഡെവലപ്പർമാർക്കും ഗവേഷകർക്കും, "In the Weights" എന്നത് മോഡൽ സ്കെയിലും ഡാറ്റാ ഡെൻസിറ്റിയും തമ്മിലുള്ള സംഘർഷത്തെ എടുത്തുകാണിക്കുന്നു. നമ്മുടെ ഡിജിറ്റൽ ഐഡന്റിറ്റികൾ പ്രൊപ്രൈറ്ററി മോഡലുകളുടെ സ്ഥിരമായ നമ്പറിക്കൽ വെയ്റ്റുകളിൽ (numerical weights) ഉൾച്ചേർക്കപ്പെടുന്ന ഈ കാലഘട്ടത്തിൽ, സ്വകാര്യതയെക്കുറിച്ചും "മറവിക്ക് അവകാശമുണ്ടെന്ന തത്വത്തെക്കുറിച്ചും" (right to be forgotten) ഇത് പ്രധാനപ്പെട്ട ചോദ്യങ്ങൾ ഉയർത്തുന്നു.

പ്രധാന കാര്യങ്ങൾ

AI മെമ്മറിയെ അളക്കൽ: ഒരു വ്യക്തിയുടെ ഐഡന്റിറ്റി ഒരു മോഡലിന്റെ വെയ്റ്റുകളിൽ എത്രത്തോളം ആഴത്തിൽ രേഖപ്പെടുത്തിയിട്ടുണ്ടെന്ന് അളക്കാൻ "In the Weights" ഒരു സ്ട്രെങ്ത് സ്കോർ (996 വരെ) ഉപയോഗിക്കുന്നു.
പ്രസക്തിയുടെ മാനദണ്ഡങ്ങൾ: Meta-യുടെ Llama പോലുള്ള ചെറിയ, പാരാമീറ്റർ-എഫിഷ്യന്റ് മോഡലുകളിൽ പ്രത്യക്ഷപ്പെടുന്നത്, ആ മോഡലിന്റെ ട്രെയിനിംഗ് ഡാറ്റയുമായി ഉയർന്ന തോതിലുള്ള ബന്ധമുണ്ടെന്ന് സൂചിപ്പിക്കുന്നു.
സാങ്കേതിക പരിമിതികൾ: ഹാലൂസിനേഷൻ, പേര് തിരിച്ചറിയുന്നതിലെ അവ്യക്തത, അക്ഷരത്തെറ്റുകളോടുള്ള സെൻസിറ്റിവിറ്റി എന്നിവയുൾപ്പെടെയുള്ള സാധാരണ LLM പോരായ്മകളെ ഈ ടൂൾ നേരിടേണ്ടതുണ്ട്.

In the Weights: New Tool Reveals Your Digital Presence in AI Models

In the Weights: AI മോഡലുകളിലെ നിങ്ങളുടെ ഡിജിറ്റൽ സാന്നിധ്യം വെളിപ്പെടുത്തുന്ന പുതിയ ടൂൾ

അറിവിന്റെ "Weights" വിശകലനം ചെയ്യുന്നു

Strength Scores വഴി പ്രശസ്തി അളക്കുന്നു

പരിമിതികളും ഹാളുസിനേഷനും (Hallucination) നേരിടുന്ന വെല്ലുവിളികളും

എന്തുകൊണ്ടാണ് ഇത് AI മേഖലയിൽ പ്രധാനമാകുന്നത്

പ്രധാന കാര്യങ്ങൾ

Continue reading

മെറ്റയുടെ AI മോഡ്: സോഷ്യൽ മീഡിയ ഡാറ്റയെ അടിസ്ഥാനമാക്കി സെർച്ച് സംവിധാനം ഒരുക്കുന്നതിലെ അപകടങ്ങൾ

New AA Briefcase Benchmark Reveals AI’s Struggle With Real Knowledge Work

In the Weights: Measuring Your Digital Legacy in the Age of LLMs