Breaking the AI Hivemind: How Flint is Combating LLM Groupthink

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial3 ദിവസം മുമ്പ്3min read

Breaking the AI Hivemind: How Flint is Combating LLM Groupthink

In this article

AI ഹൈവ്‌മൈൻഡിനെ തകർക്കുന്നു: LLM ഗ്രൂപ്പ്‌തിങ്കിംഗിനെ ഫ്ലിന്റ് (Flint) എങ്ങനെ നേരിടുന്നു

ChatGPT, Claude തുടങ്ങിയ ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ കോഡിംഗിലും ഗവേഷണത്തിലും മികവ് പുലർത്തുന്നുണ്ടെങ്കിലും, അവ പ്രവചിക്കാവുന്ന 'ഗ്രൂപ്പ്‌തിങ്കിംഗ്' (groupthink) എന്ന കെണിയിൽ വീണുകൊണ്ടിരിക്കുകയാണ്. പ്രധാനപ്പെട്ട മോഡലുകൾ ഉയർന്ന സാധ്യതയുള്ളതും ആവർത്തന സ്വഭാവമുള്ളതുമായ മറുപടികളിലേക്ക് ചുരുങ്ങുമ്പോൾ, ജനറേറ്റീവ് AI ഇക്കോസിസ്റ്റത്തിൽ അത്യാവശ്യമായ വൈവിധ്യം കൊണ്ടുവരാൻ ഒരു പുതിയ സ്റ്റാർട്ടപ്പ് ശ്രമിക്കുന്നു.

പ്രശ്നം: "ആർട്ടിഫിഷ്യൽ ഹൈവ്‌മൈൻഡ്" (Artificial Hivemind) പ്രഭാവം

നിലവിലെ LLM വികസനത്തിലെ ഒരു പ്രധാന പരിമിതി, മോഡലുകൾ ഏറ്റവും കൂടുതൽ സ്ഥിതിവിവരക്കണക്കുകൾ പ്രവചിക്കുന്ന ഉത്തരങ്ങളിലേക്ക് മാത്രം ആകർഷിക്കപ്പെടുന്നു എന്നതാണ്. ഗവേഷകർ ഇതിനെ "ആർട്ടിഫിഷ്യൽ ഹൈവ്‌മൈൻഡ്" എന്ന് വിളിക്കുന്നു. NeurIPS അവാർഡ് നേടിയ ഒരു പ്രബന്ധം, “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond),” ഈ ആഴത്തിലുള്ള ആവർത്തനത്തെ തുറന്നുകാട്ടി.

അമേരിക്കയിലെ പ്രധാന മോഡലുകളും ചൈനയിൽ നിന്നുള്ള ഓപ്പൺ സോഴ്‌സ് പതിപ്പുകളും ഉൾപ്പെടെ 25 വ്യത്യസ്ത LLM-കളെ ഗവേഷണ സംഘം പരിശോധിച്ചു. "സമയം" എന്നതിനെ ഒരു ഉപമയിലൂടെ വിവരിക്കാൻ ആവശ്യപ്പെട്ടപ്പോൾ, 1,250 മറുപടികളിൽ ഭൂരിഭാഗവും "സമയം ഒരു നദിയാണ്" അല്ലെങ്കിൽ "സമയം ഒരു നെയ്ത്തുകാരനാണ്" തുടങ്ങിയ ക്ലീഷേകളിലേക്ക് ഒതുങ്ങിപ്പോയി. ഈ വൈവിധ്യക്കുറവ് വെറുമൊരു പിഴവല്ല; വിശ്വാസ്യതയും വ്യക്തതയും പരമാവധി വർദ്ധിപ്പിക്കുക എന്ന ലക്ഷ്യത്തോടെ സമാനമായ ഡാറ്റാസെറ്റുകൾ ഉപയോഗിച്ച് മോഡലുകളെ പരിശീലിപ്പിക്കുന്നതിന്റെ ഫലമാണിത്. പുതുമയ്ക്കായി ശ്രമിക്കുന്നത് ചിലപ്പോൾ കുറഞ്ഞ വിശ്വാസ്യതയുള്ള മറുപടികൾക്ക് കാരണമായേക്കാമെന്ന് OpenAI സമ്മതിച്ചിട്ടുണ്ട്, അതുകൊണ്ടാണ് മിക്ക മോഡലുകളും സുരക്ഷിതമായ, "ഉയർന്ന സാധ്യതയുള്ള" (high-probability) ഔട്ട്‌പുട്ടുകൾ നൽകുന്നത്.

ഫ്ലിന്റ് (Flint) വരുന്നു: പ്രവചനക്ഷമതയേക്കാൾ വൈവിധ്യത്തിന് മുൻഗണന

ഓസ്‌ട്രേലിയൻ സ്റ്റാർട്ടപ്പായ Springboards തങ്ങളുടെ പുതിയ മോഡലായ Flint-ലൂടെ ഈ നിലവാരത്തെ ചോദ്യം ചെയ്യുന്നു. ഹാലൂസിനേഷനുകളെ (hallucinations) ഏതുവിധേനയും തടയാൻ ശ്രമിക്കുന്ന പ്രധാനപ്പെട്ട മോഡലുകളിൽ നിന്ന് വ്യത്യസ്തമായി, സർഗ്ഗാത്മകമായ ജോലികൾക്ക് പ്രവചനാതീതമായ ചില വ്യതിയാനങ്ങൾ ആവശ്യമാണെന്ന് Springboards CEO Pip Bingemann വാദിക്കുന്നു.

പ്രായോഗിക പരിശോധനകളിൽ, ഔട്ട്‌പുട്ട് വിതരണത്തിലെ വ്യത്യാസം വ്യക്തമാണ്:

ക്രമരഹിതത (Randomness): ഒരു ക്രമരഹിത സംഖ്യ ചോദിക്കുമ്പോൾ, ChatGPT-യും Claude-ഉം പലപ്പോഴും "7" എന്ന ഉത്തരമാണ് നൽകുന്നത്, എന്നാൽ Flint "3.7916" പോലുള്ള കൃത്യതയുള്ളതും സാധാരണമല്ലാത്തതുമായ സംഖ്യകൾ നൽകുന്നു.
സർഗ്ഗാത്മക ബ്രാൻഡിംഗ് (Creative Branding): New Balance-ന് ഒരു ടാഗ്‌ലൈൻ ആവശ്യപ്പെട്ടപ്പോൾ, Claude-ഉം ChatGPT-യും "Run your way" എന്ന് നൽകിയപ്പോൾ, Flint വ്യത്യസ്തമായ ഒരു ബദൽ നൽകി: "Built to last, run to win."
നാമപദങ്ങളുടെ തിരഞ്ഞെടുപ്പ് (Noun Selection): പ്രധാനപ്പെട്ട മോഡലുകൾ Toyota അല്ലെങ്കിൽ Honda പോലുള്ള "സുരക്ഷിതമായ" ബ്രാൻഡുകളെ തിരഞ്ഞെടുക്കുമ്പോൾ, Flint Ford F-150 പോലുള്ള പ്രവചനാതീതമായ ഓപ്ഷനുകൾ തിരഞ്ഞെടുത്ത് കൂടുതൽ വൈവിധ്യം കാണിക്കുന്നു.

പ്രൊഫഷണലുകൾക്കായുള്ള ഒരു സർഗ്ഗാത്മക ഉപകരണം

Springboards വെറുമൊരു മോഡൽ മാത്രമല്ല നിർമ്മിക്കുന്നത്; പരസ്യ_, മാർക്കറ്റിംഗ് പ്രൊഫഷണലുകൾക്കായി അവർ ഒരു പ്രത്യേക ഉപകരണം വികസിപ്പിക്കുകയാണ്. ChatGPT, Claude എന്നിവയുൾപ്പെടെയുള്ള ഒന്നിലധികം മോഡലുകളിൽ നിന്നുള്ള ഔട്ട്‌പുട്ടുകൾ ശേഖരിക്കാനും അവ സംയോജിപ്പിച്ച് പുതിയ ആശയങ്ങൾ രൂപീകരിക്കാനും ഈ പ്ലാറ്റ്‌ഫോം ഉപയോക്താക്കളെ അനുവദിക്കുന്നു. ഉപയോക്താക്കളെ അവരുടെ നിലവിലുള്ള ചിന്താഗതികളിൽ നിന്ന് പുറത്തുകൊണ്ടുവരാൻ രൂപകൽപ്പന ചെയ്ത ഒരു "ക്രിയേറ്റീവ് കാറ്റാപ്പൾട്ട്" (creative catapult) ആയി ഈ ഇക്കോസിസ്റ്റത്തിൽ Flint പ്രവർത്തിക്കുന്നു.

പ്രധാനപ്പെട്ട മോഡലുകൾ പലപ്പോഴും ഒരേ തരം പരിഹാരങ്ങൾ (ഉദാഹരണത്തിന്, "രസകരമായ രീതിയിൽ സാമ്പത്തിക സാക്ഷരത പഠിപ്പിക്കുക") നിർദ്ദേശിക്കുമ്പോൾ, Flint കാഴ്ചപ്പാടുകളിൽ വലിയ മാറ്റങ്ങൾ കൊണ്ടുവരുന്നുവെന്ന് 77X-ലെ ചീഫ് സ്ട്രാറ്റജി ഓഫീസർ Zoe Scaman നിരീക്ഷിച്ചു. ഉദാഹരണത്തിന്, സമ്പത്ത് സമ്പാദിക്കുക എന്ന സങ്കൽപ്പത്തെ തന്നെ പൂർണ്ണമായും പുനർനിർമ്മിക്കാൻ (rebranding) Flint നിർദ്ദേശിക്കുന്നു.

പ്രധാന കാര്യങ്ങൾ

LLM ഏകത (LLM Homogeneity): സമാനമായ പരിശീലന രീതികൾ കാരണം പ്രധാന മോഡലുകൾ സമാനവും പ്രവചിക്കാവുന്നതുമായ ഉത്തരങ്ങളിലേക്ക് ചുരുങ്ങുന്നു, ഇത് ഒരു "ആർട്ടിഫിഷ്യൽ ഹൈവ്‌മൈൻഡ്" പ്രഭാവം സൃഷ്ടിക്കുന്നു.
ഫ്ലിന്റ് രീതി (The Flint Approach): Springboards-ന്റെ Flint മോഡൽ മറുപടികളിലെ വൈവിധ്യത്തിനും വ്യതിയാനത്തിനും മുൻഗണന നൽകുന്നു, ഇത് സാധാരണ മോഡലുകളെ അപേക്ഷിച്ച് ബ്രെയിൻസ്റ്റോമിംഗിനും സർഗ്ഗാത്മക തന്ത്രങ്ങൾക്കും കൂടുതൽ അനുയോജ്യമാക്കുന്നു.
വിശ്വാസ്യതയും പുതുമയും തമ്മിലുള്ള സംഘർഷം (The Reliability Trade-off): മോഡലിന്റെ വിശ്വാസ്യതയും (ഉയർന്ന സാധ്യതയുള്ള പരിധിക്കുള്ളിൽ നിൽക്കുക) സർഗ്ഗാത്മകമായ പുതുമയും (കുറഞ്ഞ സാധ്യതയുള്ളതും വൈവിധ്യമാർന്നതുമായ ഔട്ട്‌പുട്ടുകൾ സ്വീകരിക്കുക) തമ്മിലുള്ള അടിസ്ഥാനപരമായ സംഘർഷം ഈ വ്യവസായം നേരിടുന്നു.

Breaking the AI Hivemind: How Flint is Combating LLM Groupthink

AI ഹൈവ്‌മൈൻഡിനെ തകർക്കുന്നു: LLM ഗ്രൂപ്പ്‌തിങ്കിംഗിനെ ഫ്ലിന്റ് (Flint) എങ്ങനെ നേരിടുന്നു

പ്രശ്നം: "ആർട്ടിഫിഷ്യൽ ഹൈവ്‌മൈൻഡ്" (Artificial Hivemind) പ്രഭാവം

ഫ്ലിന്റ് (Flint) വരുന്നു: പ്രവചനക്ഷമതയേക്കാൾ വൈവിധ്യത്തിന് മുൻഗണന

പ്രൊഫഷണലുകൾക്കായുള്ള ഒരു സർഗ്ഗാത്മക ഉപകരണം

പ്രധാന കാര്യങ്ങൾ

Continue reading

Yann LeCun Warns of Impending Bubble for OpenAI and Anthropic

New AA Briefcase Benchmark Reveals AI’s Struggle With Real Knowledge Work

Sam Altman Claims Scaling Skeptics Held Back AI Development

വാദപ്രതിവാദങ്ങളിലെ മനുഷ്യസഹജമായ വൈവിധ്യം അനുകരിക്കാൻ LLM-കൾ എന്തുകൊണ്ട് പ്രയാസപ്പെടുന്നു?

Breaking the LLM Groupthink: How Springboards is Redefining AI Creativity