AI ഹൈവ്‌മൈൻഡിനെ തകർക്കുന്നു: LLM ഗ്രൂപ്പ്‌തിങ്കിംഗിനെ ഫ്ലിന്റ് (Flint) എങ്ങനെ നേരിടുന്നു

ChatGPT, Claude തുടങ്ങിയ ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ കോഡിംഗിലും ഗവേഷണത്തിലും മികവ് പുലർത്തുന്നുണ്ടെങ്കിലും, അവ പ്രവചിക്കാവുന്ന 'ഗ്രൂപ്പ്‌തിങ്കിംഗ്' (groupthink) എന്ന കെണിയിൽ വീണുകൊണ്ടിരിക്കുകയാണ്. പ്രധാനപ്പെട്ട മോഡലുകൾ ഉയർന്ന സാധ്യതയുള്ളതും ആവർത്തന സ്വഭാവമുള്ളതുമായ മറുപടികളിലേക്ക് ചുരുങ്ങുമ്പോൾ, ജനറേറ്റീവ് AI ഇക്കോസിസ്റ്റത്തിൽ അത്യാവശ്യമായ വൈവിധ്യം കൊണ്ടുവരാൻ ഒരു പുതിയ സ്റ്റാർട്ടപ്പ് ശ്രമിക്കുന്നു.

പ്രശ്നം: "ആർട്ടിഫിഷ്യൽ ഹൈവ്‌മൈൻഡ്" (Artificial Hivemind) പ്രഭാവം

നിലവിലെ LLM വികസനത്തിലെ ഒരു പ്രധാന പരിമിതി, മോഡലുകൾ ഏറ്റവും കൂടുതൽ സ്ഥിതിവിവരക്കണക്കുകൾ പ്രവചിക്കുന്ന ഉത്തരങ്ങളിലേക്ക് മാത്രം ആകർഷിക്കപ്പെടുന്നു എന്നതാണ്. ഗവേഷകർ ഇതിനെ "ആർട്ടിഫിഷ്യൽ ഹൈവ്‌മൈൻഡ്" എന്ന് വിളിക്കുന്നു. NeurIPS അവാർഡ് നേടിയ ഒരു പ്രബന്ധം, “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond),” ഈ ആഴത്തിലുള്ള ആവർത്തനത്തെ തുറന്നുകാട്ടി.

അമേരിക്കയിലെ പ്രധാന മോഡലുകളും ചൈനയിൽ നിന്നുള്ള ഓപ്പൺ സോഴ്‌സ് പതിപ്പുകളും ഉൾപ്പെടെ 25 വ്യത്യസ്ത LLM-കളെ ഗവേഷണ സംഘം പരിശോധിച്ചു. "സമയം" എന്നതിനെ ഒരു ഉപമയിലൂടെ വിവരിക്കാൻ ആവശ്യപ്പെട്ടപ്പോൾ, 1,250 മറുപടികളിൽ ഭൂരിഭാഗവും "സമയം ഒരു നദിയാണ്" അല്ലെങ്കിൽ "സമയം ഒരു നെയ്ത്തുകാരനാണ്" തുടങ്ങിയ ക്ലീഷേകളിലേക്ക് ഒതുങ്ങിപ്പോയി. ഈ വൈവിധ്യക്കുറവ് വെറുമൊരു പിഴവല്ല; വിശ്വാസ്യതയും വ്യക്തതയും പരമാവധി വർദ്ധിപ്പിക്കുക എന്ന ലക്ഷ്യത്തോടെ സമാനമായ ഡാറ്റാസെറ്റുകൾ ഉപയോഗിച്ച് മോഡലുകളെ പരിശീലിപ്പിക്കുന്നതിന്റെ ഫലമാണിത്. പുതുമയ്ക്കായി ശ്രമിക്കുന്നത് ചിലപ്പോൾ കുറഞ്ഞ വിശ്വാസ്യതയുള്ള മറുപടികൾക്ക് കാരണമായേക്കാമെന്ന് OpenAI സമ്മതിച്ചിട്ടുണ്ട്, അതുകൊണ്ടാണ് മിക്ക മോഡലുകളും സുരക്ഷിതമായ, "ഉയർന്ന സാധ്യതയുള്ള" (high-probability) ഔട്ട്‌പുട്ടുകൾ നൽകുന്നത്.

ഫ്ലിന്റ് (Flint) വരുന്നു: പ്രവചനക്ഷമതയേക്കാൾ വൈവിധ്യത്തിന് മുൻഗണന

ഓസ്‌ട്രേലിയൻ സ്റ്റാർട്ടപ്പായ Springboards തങ്ങളുടെ പുതിയ മോഡലായ Flint-ലൂടെ ഈ നിലവാരത്തെ ചോദ്യം ചെയ്യുന്നു. ഹാലൂസിനേഷനുകളെ (hallucinations) ഏതുവിധേനയും തടയാൻ ശ്രമിക്കുന്ന പ്രധാനപ്പെട്ട മോഡലുകളിൽ നിന്ന് വ്യത്യസ്തമായി, സർഗ്ഗാത്മകമായ ജോലികൾക്ക് പ്രവചനാതീതമായ ചില വ്യതിയാനങ്ങൾ ആവശ്യമാണെന്ന് Springboards CEO Pip Bingemann വാദിക്കുന്നു.

പ്രായോഗിക പരിശോധനകളിൽ, ഔട്ട്‌പുട്ട് വിതരണത്തിലെ വ്യത്യാസം വ്യക്തമാണ്:

  • ക്രമരഹിതത (Randomness): ഒരു ക്രമരഹിത സംഖ്യ ചോദിക്കുമ്പോൾ, ChatGPT-യും Claude-ഉം പലപ്പോഴും "7" എന്ന ഉത്തരമാണ് നൽകുന്നത്, എന്നാൽ Flint "3.7916" പോലുള്ള കൃത്യതയുള്ളതും സാധാരണമല്ലാത്തതുമായ സംഖ്യകൾ നൽകുന്നു.
  • സർഗ്ഗാത്മക ബ്രാൻഡിംഗ് (Creative Branding): New Balance-ന് ഒരു ടാഗ്‌ലൈൻ ആവശ്യപ്പെട്ടപ്പോൾ, Claude-ഉം ChatGPT-യും "Run your way" എന്ന് നൽകിയപ്പോൾ, Flint വ്യത്യസ്തമായ ഒരു ബദൽ നൽകി: "Built to last, run to win."
  • നാമപദങ്ങളുടെ തിരഞ്ഞെടുപ്പ് (Noun Selection): പ്രധാനപ്പെട്ട മോഡലുകൾ Toyota അല്ലെങ്കിൽ Honda പോലുള്ള "സുരക്ഷിതമായ" ബ്രാൻഡുകളെ തിരഞ്ഞെടുക്കുമ്പോൾ, Flint Ford F-150 പോലുള്ള പ്രവചനാതീതമായ ഓപ്ഷനുകൾ തിരഞ്ഞെടുത്ത് കൂടുതൽ വൈവിധ്യം കാണിക്കുന്നു.

പ്രൊഫഷണലുകൾക്കായുള്ള ഒരു സർഗ്ഗാത്മക ഉപകരണം

Springboards വെറുമൊരു മോഡൽ മാത്രമല്ല നിർമ്മിക്കുന്നത്; പരസ്യ_, മാർക്കറ്റിംഗ് പ്രൊഫഷണലുകൾക്കായി അവർ ഒരു പ്രത്യേക ഉപകരണം വികസിപ്പിക്കുകയാണ്. ChatGPT, Claude എന്നിവയുൾപ്പെടെയുള്ള ഒന്നിലധികം മോഡലുകളിൽ നിന്നുള്ള ഔട്ട്‌പുട്ടുകൾ ശേഖരിക്കാനും അവ സംയോജിപ്പിച്ച് പുതിയ ആശയങ്ങൾ രൂപീകരിക്കാനും ഈ പ്ലാറ്റ്‌ഫോം ഉപയോക്താക്കളെ അനുവദിക്കുന്നു. ഉപയോക്താക്കളെ അവരുടെ നിലവിലുള്ള ചിന്താഗതികളിൽ നിന്ന് പുറത്തുകൊണ്ടുവരാൻ രൂപകൽപ്പന ചെയ്ത ഒരു "ക്രിയേറ്റീവ് കാറ്റാപ്പൾട്ട്" (creative catapult) ആയി ഈ ഇക്കോസിസ്റ്റത്തിൽ Flint പ്രവർത്തിക്കുന്നു.

പ്രധാനപ്പെട്ട മോഡലുകൾ പലപ്പോഴും ഒരേ തരം പരിഹാരങ്ങൾ (ഉദാഹരണത്തിന്, "രസകരമായ രീതിയിൽ സാമ്പത്തിക സാക്ഷരത പഠിപ്പിക്കുക") നിർദ്ദേശിക്കുമ്പോൾ, Flint കാഴ്ചപ്പാടുകളിൽ വലിയ മാറ്റങ്ങൾ കൊണ്ടുവരുന്നുവെന്ന് 77X-ലെ ചീഫ് സ്ട്രാറ്റജി ഓഫീസർ Zoe Scaman നിരീക്ഷിച്ചു. ഉദാഹരണത്തിന്, സമ്പത്ത് സമ്പാദിക്കുക എന്ന സങ്കൽപ്പത്തെ തന്നെ പൂർണ്ണമായും പുനർനിർമ്മിക്കാൻ (rebranding) Flint നിർദ്ദേശിക്കുന്നു.

പ്രധാന കാര്യങ്ങൾ

  • LLM ഏകത (LLM Homogeneity): സമാനമായ പരിശീലന രീതികൾ കാരണം പ്രധാന മോഡലുകൾ സമാനവും പ്രവചിക്കാവുന്നതുമായ ഉത്തരങ്ങളിലേക്ക് ചുരുങ്ങുന്നു, ഇത് ഒരു "ആർട്ടിഫിഷ്യൽ ഹൈവ്‌മൈൻഡ്" പ്രഭാവം സൃഷ്ടിക്കുന്നു.
  • ഫ്ലിന്റ് രീതി (The Flint Approach): Springboards-ന്റെ Flint മോഡൽ മറുപടികളിലെ വൈവിധ്യത്തിനും വ്യതിയാനത്തിനും മുൻഗണന നൽകുന്നു, ഇത് സാധാരണ മോഡലുകളെ അപേക്ഷിച്ച് ബ്രെയിൻസ്റ്റോമിംഗിനും സർഗ്ഗാത്മക തന്ത്രങ്ങൾക്കും കൂടുതൽ അനുയോജ്യമാക്കുന്നു.
  • വിശ്വാസ്യതയും പുതുമയും തമ്മിലുള്ള സംഘർഷം (The Reliability Trade-off): മോഡലിന്റെ വിശ്വാസ്യതയും (ഉയർന്ന സാധ്യതയുള്ള പരിധിക്കുള്ളിൽ നിൽക്കുക) സർഗ്ഗാത്മകമായ പുതുമയും (കുറഞ്ഞ സാധ്യതയുള്ളതും വൈവിധ്യമാർന്നതുമായ ഔട്ട്‌പുട്ടുകൾ സ്വീകരിക്കുക) തമ്മിലുള്ള അടിസ്ഥാനപരമായ സംഘർഷം ഈ വ്യവസായം നേരിടുന്നു.