𝗙𝗿𝗼𝗺 𝗘𝘅𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧 𝘁𝗼 𝗜𝗺𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧

📅1 hour ago⏱1 min read

Explicit CoT-ൽ നിന്ന് Implicit CoT-ലേക്ക്

AI മോഡലുകൾ ഘട്ടം ഘട്ടമായി ചിന്തിച്ചുകൊണ്ടാണ് സങ്കീർണ്ണമായ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നത്. ഈ പ്രക്രിയയെ Chain of Thought അല്ലെങ്കിൽ CoT എന്ന് വിളിക്കുന്നു.

മിക്ക മോഡലുകളും Explicit CoT ആണ് ഉപയോഗിക്കുന്നത്. ഒരു ഉത്തരം നൽകുന്നതിന് മുമ്പ് അവ ഓരോ ചിന്തയും എഴുതിത്തീർക്കുന്നു. ഇത് മോഡലിന്റെ വേഗത കുറയ്ക്കുന്നു. കൂടാതെ ഇത് കൂടുതൽ ടോക്കണുകൾ (tokens) ഉപയോഗിക്കുകയും ചെയ്യുന്നു.

പുതിയ ഗവേഷണങ്ങൾ ഇതിനൊരു മികച്ച മാർഗ്ഗം കാണിച്ചുതരുന്നു. മോഡലുകൾക്ക് Implicit CoT-ലേക്ക് മാറാൻ കഴിയും. അതായത്, മോഡൽ യുക്തിപരമായ ഘട്ടങ്ങളെ (reasoning steps) ഉള്ളിൽ തന്നെ ഉൾക്കൊള്ളുന്നു. ഓരോ വാക്കും എഴുതിത്തീർക്കാതെ തന്നെ ലോജിക് വഴി ചിന്തിക്കാൻ ഇത് സഹായിക്കുന്നു.

ഈ മാറ്റം AI പ്രവർത്തിക്കുന്ന രീതിയെ തന്നെ മാറ്റുന്നു. ഇത് മോഡലുകളെ വേഗതയുള്ളതാക്കുന്നു. അവയെ കൂടുതൽ കാര്യക്ഷമമാക്കുകയും ചെയ്യുന്നു.

ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നു:

മോഡലുകൾ ലോജിക് പാറ്റേണുകൾ പിന്തുടരാൻ പഠിക്കുന്നു.
അവ യുക്തിപരമായ ചിന്തകളെ (reasoning) ഔട്ട്‌പുട്ടിൽ നിന്ന് ഹിഡൻ ലെയറുകളിലേക്ക് (hidden layers) മാറ്റുന്നു.
കുറഞ്ഞ ടെക്സ്റ്റ് ഉപയോഗിച്ച് മോഡലിന് സങ്കീർണ്ണമായ പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ കഴിയുന്നു.

ഈ ഘട്ടങ്ങൾ ഉൾക്കൊള്ളാൻ ഒരു മോഡലിനെ പരിശീലിപ്പിക്കുന്നതിന് പ്രത്യേക ഡാറ്റയും രീതികളും ആവശ്യമാണ്. ഇത് ജനറേഷൻ ചിലവ് കുറയ്ക്കുന്നതോടൊപ്പം കൃത്യത നിലനിർത്താനും മോഡലിനെ സഹായിക്കുന്നു.

നിങ്ങൾ ഈ മേഖലയെ സൂക്ഷ്മമായി നിരീക്ഷിക്കണം. കാര്യക്ഷമമായ യുക്തിചിന്ത (Efficient reasoning) എന്നത് ലാർജ് ലാംഗ്വേജ് മോഡലുകളുടെ (large language models) അടുത്ത ഘട്ടമാണ്.

Source: https://dev.to/paperium/from-explicit-cot-to-implicit-cot-learning-to-internalize-cot-step-by-step-b59

Optional learning community: https://t.me/GyaanSetuAi

𝗙𝗿𝗼𝗺 𝗘𝘅𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧 𝘁𝗼 𝗜𝗺𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗗𝗼𝗻𝘁 𝗟𝗲𝘁 𝗔𝗜 𝗧𝗵𝗶𝗻𝗸 𝗙𝗼𝗿 𝗬𝗼𝘂

AI എന്നത് പ്രോംപ്റ്റുകൾക്ക് അപ്പുറമാണ്

𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝗜𝘀 𝗧𝗵𝗲 𝗠𝗼𝘀𝘁 𝗛𝗼𝗻𝗲𝘀𝘁 𝗣𝗮𝗿𝘁 𝗢𝗳 𝗔𝗜

𝗔𝗜 𝗢𝗻𝗹𝘆 𝗪𝗼𝗿𝗸𝘀 𝗜𝗳 𝗬𝗼𝘂 𝗛𝗮𝘃𝗲 𝗙𝗮𝗰𝗲𝗱 𝗧𝗵𝗲 𝗦𝘁𝗿𝘂𝗴𝗴𝗹𝗲