𝗘𝘅𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧 ਤੋਂ 𝗜𝗺𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧 ਤੱਕ

AI ਮਾਡਲ ਕਦਮ-ਦਰ-ਕਦਮ ਸੋਚ ਕੇ ਔਖੀਆਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਦੇ ਹਨ। ਇਸ ਪ੍ਰਕਿਰਿਆ ਨੂੰ Chain of Thought ਜਾਂ CoT ਕਿਹਾ ਜਾਂਦਾ ਹੈ।

ਜ਼ਿਆਦਾਤਰ ਮਾਡਲ Explicit CoT ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। ਉਹ ਜਵਾਬ ਦੇਣ ਤੋਂ ਪਹਿਲਾਂ ਹਰ ਇੱਕ ਵਿਚਾਰ ਨੂੰ ਲਿਖਦੇ ਹਨ। ਇਹ ਮਾਡਲ ਨੂੰ ਹੌਲੀ ਬਣਾਉਂਦਾ ਹੈ। ਇਹ ਬਹੁਤ ਸਾਰੇ tokens ਦੀ ਵਰਤੋਂ ਵੀ ਕਰਦਾ ਹੈ।

ਨਵੀਂ ਖੋਜ ਇੱਕ ਬਿਹਤਰ ਤਰੀਕਾ ਦਿਖਾਉਂਦੀ ਹੈ। ਮਾਡਲ Implicit CoT ਵੱਲ ਵਧ ਸਕਦੇ ਹਨ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਮਾਡਲ ਤਰਕ ਦੇ ਕਦਮਾਂ ਨੂੰ ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ ਅਪਣਾ ਲੈਂਦਾ ਹੈ। ਇਹ ਹਰ ਸ਼ਬਦ ਨੂੰ ਲਿਖੇ ਬਿਨਾਂ ਤਰਕ ਰਾਹੀਂ ਸੋਚਦਾ ਹੈ।

ਇਹ ਬਦਲਾਅ AI ਦੇ ਕੰਮ ਕਰਨ ਦੇ ਤਰੀਕੇ ਨੂੰ ਬਦਲ ਦਿੰਦਾ ਹੈ। ਇਹ ਮਾਡਲਾਂ ਨੂੰ ਤੇਜ਼ ਬਣਾਉਂਦਾ ਹੈ। ਇਹ ਉਹਨਾਂ ਨੂੰ ਵਧੇਰੇ ਕੁਸ਼ਲ (efficient) ਬਣਾਉਂਦਾ ਹੈ।

ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ:

ਇਹਨਾਂ ਕਦਮਾਂ ਨੂੰ ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ ਅਪਣਾਉਣ ਲਈ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਿਸ਼ੇਸ਼ ਡੇਟਾ ਅਤੇ ਤਰੀਕਿਆਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹ ਜਨਰੇਸ਼ਨ ਦੀ ਲਾਗਤ ਨੂੰ ਘਟਾਉਂਦੇ ਹੋਏ ਮਾਡਲ ਦੀ ਸ਼ੁੱਧਤਾ (accuracy) ਬਣਾਈ ਰੱਖਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ।

ਤੁਹਾਨੂੰ ਇਸ ਖੇਤਰ 'ਤੇ ਨੇੜਿਓਂ ਨਜ਼ਰ ਰੱਖਣੀ ਚਾਹੀਦੀ ਹੈ। ਕੁਸ਼ਲ ਤਰਕ (Efficient reasoning) ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (large language models) ਲਈ ਅਗਲਾ ਕਦਮ ਹੈ।

Source: https://dev.to/paperium/from-explicit-cot-to-implicit-cot-learning-to-internalize-cot-step-by-step-b59

Optional learning community: https://t.me/GyaanSetuAi