Explicit CoT-ൽ നിന്ന് Implicit CoT-ലേക്ക്
AI മോഡലുകൾ ഘട്ടം ഘട്ടമായി ചിന്തിച്ചുകൊണ്ടാണ് സങ്കീർണ്ണമായ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നത്. ഈ പ്രക്രിയയെ Chain of Thought അല്ലെങ്കിൽ CoT എന്ന് വിളിക്കുന്നു.
മിക്ക മോഡലുകളും Explicit CoT ആണ് ഉപയോഗിക്കുന്നത്. ഒരു ഉത്തരം നൽകുന്നതിന് മുമ്പ് അവ ഓരോ ചിന്തയും എഴുതിത്തീർക്കുന്നു. ഇത് മോഡലിന്റെ വേഗത കുറയ്ക്കുന്നു. കൂടാതെ ഇത് കൂടുതൽ ടോക്കണുകൾ (tokens) ഉപയോഗിക്കുകയും ചെയ്യുന്നു.
പുതിയ ഗവേഷണങ്ങൾ ഇതിനൊരു മികച്ച മാർഗ്ഗം കാണിച്ചുതരുന്നു. മോഡലുകൾക്ക് Implicit CoT-ലേക്ക് മാറാൻ കഴിയും. അതായത്, മോഡൽ യുക്തിപരമായ ഘട്ടങ്ങളെ (reasoning steps) ഉള്ളിൽ തന്നെ ഉൾക്കൊള്ളുന്നു. ഓരോ വാക്കും എഴുതിത്തീർക്കാതെ തന്നെ ലോജിക് വഴി ചിന്തിക്കാൻ ഇത് സഹായിക്കുന്നു.
ഈ മാറ്റം AI പ്രവർത്തിക്കുന്ന രീതിയെ തന്നെ മാറ്റുന്നു. ഇത് മോഡലുകളെ വേഗതയുള്ളതാക്കുന്നു. അവയെ കൂടുതൽ കാര്യക്ഷമമാക്കുകയും ചെയ്യുന്നു.
ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നു:
- മോഡലുകൾ ലോജിക് പാറ്റേണുകൾ പിന്തുടരാൻ പഠിക്കുന്നു.
- അവ യുക്തിപരമായ ചിന്തകളെ (reasoning) ഔട്ട്പുട്ടിൽ നിന്ന് ഹിഡൻ ലെയറുകളിലേക്ക് (hidden layers) മാറ്റുന്നു.
- കുറഞ്ഞ ടെക്സ്റ്റ് ഉപയോഗിച്ച് മോഡലിന് സങ്കീർണ്ണമായ പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ കഴിയുന്നു.
ഈ ഘട്ടങ്ങൾ ഉൾക്കൊള്ളാൻ ഒരു മോഡലിനെ പരിശീലിപ്പിക്കുന്നതിന് പ്രത്യേക ഡാറ്റയും രീതികളും ആവശ്യമാണ്. ഇത് ജനറേഷൻ ചിലവ് കുറയ്ക്കുന്നതോടൊപ്പം കൃത്യത നിലനിർത്താനും മോഡലിനെ സഹായിക്കുന്നു.
നിങ്ങൾ ഈ മേഖലയെ സൂക്ഷ്മമായി നിരീക്ഷിക്കണം. കാര്യക്ഷമമായ യുക്തിചിന്ത (Efficient reasoning) എന്നത് ലാർജ് ലാംഗ്വേജ് മോഡലുകളുടെ (large language models) അടുത്ത ഘട്ടമാണ്.
Optional learning community: https://t.me/GyaanSetuAi