AI Hivemind ને તોડવું: Flint કેવી રીતે LLM Groupthink સામે લડી રહ્યું છે
જ્યારે ChatGPT અને Claude જેવા લાર્જ લેંગ્વેજ મોડલ્સ (LLMs) કોડિંગ અને સંશોધનમાં ઉત્કૃષ્ટ છે, ત્યારે તેઓ વધુને વધુ અનુમાનિત "groupthink" ના જાળમાં ફસાઈ રહ્યા છે. જેમ જેમ મુખ્ય પ્રવાહના મોડલ્સ ઉચ્ચ-સંભાવના ધરાવતા, પુનરાવર્તિત જવાબો તરફ વળી રહ્યા છે, તેમ એક નવું સ્ટાર્ટઅપ જનરેટિવ AI ઇકોસિસ્ટમમાં અત્યંત જરૂરી વિવિધતા (divergence) લાવવાનો પ્રયાસ કરી રહ્યું છે.
સમસ્યા: "Artificial Hivemind" અસર
વર્તમાન LLM વિકાસમાં એક મોટી મર્યાદા એ છે કે મોડલ્સ આંકડાકીય રીતે સૌથી વધુ સંભવિત જવાબ તરફ ઝૂકવાની વૃત્તિ ધરાવે છે, જે સંશોધકો દ્વારા "Artificial Hivemind" કહેવામાં આવતી ઘટના તરફ દોરી જાય છે. NeurIPS એવોર્ડ વિજેતા પેપર, “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond),” એ આ ઊંડા મૂળ ધરાવતી પુનરાવૃત્તિને ખુલ્લી પાડી છે.
સંશોધન ટીમે અમેરિકાના મુખ્ય મોડલ્સ અને ચીનના ઓપન-સોર્સ વર્ઝન સહિત 25 અલગ-અલગ LLMs નું પરીક્ષણ કર્યું. જ્યારે "સમય" (time) માટે રૂપક (metaphor) પૂછવામાં આવ્યું, ત્યારે 1,250 જવાબોમાંથી મોટાભાગના જવાબો "સમય એ નદી છે" અથવા "સમય એ વણકર છે" જેવા રૂઢિચુસ્ત (clichés) જવાબો પર આવીને અટકી ગયા. વિવિધતાનો આ અભાવ માત્ર એક વિચિત્રતા નથી; તે વિશ્વસનીયતા અને સુસંગતતા વધારવાના મુખ્ય ઉદ્દેશ્ય સાથે સમાન ડેટાસેટ્સ પર મોડલ્સને તાલીમ આપવાનું પરિણામ છે. OpenAI એ સ્વીકાર્યું છે કે નવીનતા માટે દબાણ કરવાથી ક્યારેક નબળા અને ઓછા વિશ્વસનીય જવાબો મળી શકે છે, તેથી જ મોટાભાગના મોડલ્સ સુરક્ષિત, "ઉચ્ચ-સંભાવના" ધરાવતા આઉટપુટ પર નિર્ભર રહે છે.
Flint નું આગમન: અનુમાનિતતા કરતાં વિવિધતાને પ્રાધાન્ય
ઓસ્ટ્રેલિયન સ્ટાર્ટઅપ Springboards તેના નવા મોડલ, Flint સાથે આ સ્થિતિને પડકારી રહ્યું છે. મુખ્ય પ્રવાહના મોડલ્સથી વિપરીત, જે કોઈપણ કિંમતે hallucinations સામે લડે છે, Springboards ના CEO Pip Bingemann દલીલ કરે છે કે સર્જનાત્મક કાર્યો માટે અમુક અંશે અનિશ્ચિત વિવિધતા (unpredictable divergence) જરૂરી છે.
વ્યવહારિક પરીક્ષણમાં, આઉટપુટ વિતરણમાં તફાવત સ્પષ્ટ છે:
- Randomness (યાદચ્છિકતા): જ્યારે રેન્ડમ નંબર પૂછવામાં આવે ત્યારે, ChatGPT અને Claude વારંવાર "7" આપતા હતા, જ્યારે Flint એ "3.7916" જેવા ઉચ્ચ-ચોકસાઈ ધરાવતા, બિન-પ્રમાણિત નંબરો આપ્યા.
- Creative Branding (સર્જનાત્મક બ્રાન્ડિંગ): જ્યારે New Balance માટે ટેગલાઇન પૂછવામાં આવી, ત્યારે Claude અને ChatGPT બંનેએ "Run your way" આપ્યું, જ્યારે Flint એ એક અલગ વિકલ્પ આપ્યો: "Built to last, run to win."
- Noun Selection (નામ પસંદગી): જ્યાં મુખ્ય પ્રવાહના મોડલ્સ Toyota અથવા Honda જેવા "સુરક્ષિત" બ્રાન્ડ્સ તરફ ઝૂકે છે, ત્યાં Flint વધુ વ્યાપક શ્રેણી દર્શાવે છે, અને Ford F-150 જેવા ઓછા અનુમાનિત વિકલ્પો પસંદ કરે છે.
વ્યાવસાયિકો માટે એક સર્જનાત્મક સાધન
Springboards માત્ર એક સ્વતંત્ર મોડલ જ નથી બનાવી રહ્યું; તેઓ જાહેરાત અને માર્કેટિંગ વ્યાવસાયિકો માટે એક વિશિષ્ટ સાધન વિકસાવી રહ્યા છે. આ પ્લેટફોર્મ વપરાશકર્તાઓને ChatGPT અને Claude સહિતના અનેક મોડલ્સના આઉટપુટ એકત્રિત કરવાની અને નવા વિચારો બનાવવા માટે તેમને જોડવાની મંજૂરી આપે છે. Flint આ ઇકોસિસ્ટમમાં એક "creative catapult" તરીકે કામ કરે છે, જે ખાસ કરીને વપરાશકર્તાઓને તેમના હાલના માનસિક માળખામાંથી બહાર લાવવા માટે ડિઝાઇન કરવામાં આવ્યું છે.
77X ના Chief Strategy Officer Zoe Scaman એ નોંધ્યું કે જ્યારે મુખ્ય પ્રવાહના મોડલ્સ વારંવાર એ જ જૂના ઉકેલો સૂચવે છે (જેમ કે "મનોરંજક રીતે નાણાકીય સાક્ષરતા શીખવવી"), ત્યારે Flint દ્રષ્ટિકોણમાં આમૂલ પરિવર્તન લાવે છે, જેમ કે સંપત્તિના સંચય (wealth accumulation) ના ખ્યાલનું જ સંપૂર્ણ રીબ્રાન્ડિંગ સૂચવવું.
મુખ્ય મુદ્દાઓ
- LLM Homogeneity (એકરૂપતા): સમાન તાલીમ પદ્ધતિઓને કારણે મુખ્ય મોડલ્સ સમાન અને અનુમાનિત જવાબો તરફ વળી રહ્યા છે, જે "Artificial Hivemind" અસર પેદા કરે છે.
- The Flint Approach (Flint અભિગમ): Springboards નું Flint મોડલ પ્રતિસાદની વિવિધતા અને વિવિધતાને પ્રાધાન્ય આપે છે, જે તેને પ્રમાણભૂત મોડલ્સ કરતા બ્રેઈનસ્ટોર્મિંગ અને સર્જનાત્મક વ્યૂહરચના માટે વધુ યોગ્ય બનાવે છે.
- The Reliability Trade-off (વિશ્વસનીયતાનો બદલો): ઉદ્યોગ મોડલની વિશ્વસનીયતા (ઉચ્ચ-સંભાવનાની મર્યાદામાં રહેવું) અને સર્જનાત્મક નવીનતા (ઓછી સંભાવના ધરાવતા, વૈવિધ્યસભર આઉટપુટ અપનાવવું) વચ્ચેના મૂળભૂત તણાવનો સામનો કરી રહ્યો છે.
