Explicit CoT से Implicit CoT तक
AI मॉडल कदम-दर-कदम सोचकर कठिन समस्याओं को हल करते हैं। इस प्रक्रिया को Chain of Thought या CoT कहा जाता है।
अधिकांश मॉडल Explicit CoT का उपयोग करते हैं। वे उत्तर देने से पहले अपने हर एक विचार को विस्तार से लिखते हैं। इससे मॉडल धीमा हो जाता है और इसमें बहुत अधिक टोकन (tokens) का उपयोग होता है।
नया शोध एक बेहतर तरीका दिखाता है। मॉडल Implicit CoT की ओर बढ़ सकते हैं। इसका अर्थ है कि मॉडल तर्क के चरणों को आंतरिक रूप से आत्मसात कर लेता है। यह हर शब्द को लिखे बिना तर्क के माध्यम से सोचता है।
यह बदलाव AI के काम करने के तरीके को बदल देता है। यह मॉडलों को तेज़ बनाता है और उन्हें अधिक कुशल बनाता है।
यह कैसे काम करता है:
- मॉडल तर्क के पैटर्न (logic patterns) का पालन करना सीखते हैं।
- वे तर्क (reasoning) को आउटपुट से हटाकर हिडन लेयर्स (hidden layers) में ले जाते हैं।
- मॉडल कम टेक्स्ट के साथ जटिल समस्याओं को हल करता है।
इन चरणों को आत्मसात करने के लिए मॉडल को प्रशिक्षित करने हेतु विशिष्ट डेटा और विधियों की आवश्यकता होती है। यह जनरेशन की लागत को कम करते हुए मॉडल की सटीकता बनाए रखने में मदद करता है।
आपको इस क्षेत्र पर बारीकी से नज़र रखनी चाहिए। कुशल तर्क (efficient reasoning) बड़े भाषा मॉडलों (large language models) के लिए अगला कदम है।
Optional learning community: https://t.me/GyaanSetuAi