AI Hivemind तोडणे: Flint कशा प्रकारे LLM Groupthink ला रोखत आहे

ChatGPT आणि Claude सारखे Large Language Models कोडिंग आणि संशोधनात उत्कृष्ट असले तरी, ते अधिकाधिक अंदाजित "groupthink" (समूह विचारसरणी) च्या जाळ्यात अडकत आहेत. मुख्य प्रवाहातील मॉडेल्स उच्च-संभाव्यता असलेल्या, पुनरावृत्ती होणाऱ्या उत्तरांकडे झुकत असताना, एक नवीन स्टार्टअप जनरेटिव्ह AI इकोसिस्टममध्ये अत्यंत आवश्यक असलेला वैविध्यपूर्ण दृष्टिकोन (divergence) आणण्याचा प्रयत्न करत आहे.

समस्या: "Artificial Hivemind" चा परिणाम

सध्याच्या LLM विकासातील एक मोठी मर्यादा म्हणजे मॉडेल्सची सर्वात सांख्यिकीयदृष्ट्या संभाव्य उत्तराकडे झुकण्याची प्रवृत्ती, ज्यामुळे संशोधक ज्याला "Artificial Hivemind" म्हणतात, असा एक प्रकार निर्माण होतो. NeurIPS पुरस्कार विजेता शोधनिबंध, “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond),” ने या खोलवर रुजलेल्या पुनरावृत्तीचा पर्दाफाश केला आहे.

संशोधन पथकाने अमेरिकेतील प्रमुख मॉडेल्स आणि चीनमधील ओपन-सोर्स आवृत्त्यांसह २५ वेगवेगळ्या LLMs ची चाचणी घेतली. जेव्हा "वेळ" (time) साठी रूपक विचारण्यात आले, तेव्हा १,२५० उत्तरांपैकी बहुतांश उत्तरे "वेळ ही नदी आहे" किंवा "वेळ ही विणकर आहे" यांसारख्या घिसाट्या (clichés) म्हणींवर येऊन थांबली. वैविध्याचा हा अभाव केवळ एक विचित्र गोष्ट नाही; तर विश्वसनीयता आणि सुसंगतता वाढवण्याच्या मुख्य उद्दिष्टाने समान डेटासेटवर मॉडेल्स प्रशिक्षित केल्यामुळे निर्माण झालेला हा एक परिणाम आहे. OpenAI ने मान्य केले आहे की नाविन्यासाठी प्रयत्न केल्यास कधीकधी उत्तरे कमकुवत आणि कमी विश्वसनीय असू शकतात, म्हणूनच बहुतेक मॉडेल्स सुरक्षित आणि "उच्च-संभाव्यता" असलेल्या आउटपुट्सचा वापर करतात.

Flint चे आगमन: अंदाजित उत्तरांपेक्षा वैविध्याला प्राधान्य

ऑस्ट्रेलियन स्टार्टअप Springboards आपल्या नवीन मॉडेलसह, Flint, या सद्यस्थितीला आव्हान देत आहे. कोणत्याही परिस्थितीत hallucinations (भ्रमित माहिती) टाळण्यासाठी प्रयत्न करणाऱ्या मुख्य प्रवाहातील मॉडेल्सच्या उलट, Springboards चे CEO Pip Bingemann यांचा असा युक्तिवाद आहे की सर्जनशील कामांसाठी काही प्रमाणात अनपेक्षित वैविध्य (unpredictable divergence) आवश्यक आहे.

प्रत्यक्ष चाचणीमध्ये, आउटपुट वितरणातील फरक स्पष्टपणे दिसून येतो:

  • Randomness (यादृच्छिकता): जेव्हा यादृच्छिक संख्या विचारली गेली, तेव्हा ChatGPT आणि Claude वारंवार "7" हे उत्तर देत होते, तर Flint ने "3.7916" सारख्या उच्च-अचूकता असलेल्या, गैर-प्रमाणित संख्या दिल्या.
  • Creative Branding (सर्जनशील ब्रँडिंग): जेव्हा New Balance साठी टॅगलाईन विचारली गेली, तेव्हा Claude आणि ChatGPT या दोघांनीही "Run your way" असे उत्तर दिले, तर Flint ने एक वेगळा पर्याय दिला: "Built to last, run to win."
  • Noun Selection (नाम निवड): जिथे मुख्य प्रवाहातील मॉडेल्स Toyota किंवा Honda सारख्या "सुरक्षित" ब्रँड्सकडे झुकतात, तिथे Flint ने Ford F-150 सारखे कमी अंदाजित पर्याय निवडून अधिक व्यापक श्रेणी दर्शवली.

व्यावसायिकांसाठी एक सर्जनशील साधन

Springboards केवळ एक स्वतंत्र मॉडेल तयार करत नाहीये; ते जाहिरात आणि मार्केटिंग व्यावसायिकांसाठी एक विशेष साधन विकसित करत आहेत. हे प्लॅटफॉर्म वापरकर्त्यांना ChatGPT आणि Claude सह अनेक मॉडेल्सची आउटपुट्स एकत्रित करण्याची आणि नवीन कल्पना तयार करण्यासाठी त्यांचा वापर करण्याची परवानगी देते. Flint या इकोसिस्टममध्ये एक "creative catapult" (सर्जनशील कॅटापल्ट) म्हणून काम करते, जे वापरकर्त्यांना त्यांच्या सध्याच्या मानसिक चौकटीतून बाहेर काढण्यासाठी विशेषतः डिझाइन केलेले आहे.

77X च्या Chief Strategy Officer Zoe Scaman यांनी नमूद केले की, मुख्य प्रवाहातील मॉडेल्स अनेकदा तीच जुनी उत्तरे सुचवतात (जसे की "मजेदार पद्धतीने आर्थिक साक्षरता शिकवणे"), तर Flint दृष्टिकोनात आमूलाग्र बदल घडवून आणते, जसे की संपत्ती संचयनाच्या संकल्पनेचे पूर्णपणे रीब्रँडिंग सुचवणे.

मुख्य निष्कर्ष

  • LLM Homogeneity (एकरूपता): समान प्रशिक्षण पद्धतींमुळे प्रमुख मॉडेल्स समान आणि अंदाजित उत्तरांकडे झुकत आहेत, ज्यामुळे "Artificial Hivemind" चा परिणाम निर्माण होत आहे.
  • The Flint Approach (Flint चा दृष्टिकोन): Springboards चे Flint मॉडेल प्रतिसादातील विविधता आणि वैविध्यतेला प्राधान्य देते, ज्यामुळे ते मानक मॉडेल्सपेक्षा ब्रेनस्टॉर्मिंग आणि सर्जनशील रणनीतीसाठी अधिक उपयुक्त ठरते.
  • The Reliability Trade-off (विश्वसनीयतेचा तडजोड): उद्योग क्षेत्रासमोर मॉडेलची विश्वसनीयता (उच्च-संभाव्यता मर्यादेत राहणे) आणि सर्जनशील नाविन्य (कमी-संभाव्यता असलेल्या, वैविध्यपूर्ण आउटपुट्सचा स्वीकार करणे) यामधील मूलभूत तणाव आहे.