Explicit CoT થી Implicit CoT સુધી
AI મોડલ્સ સ્ટેપ-બાય-સ્ટેપ વિચારીને અઘરી સમસ્યાઓ ઉકેલે છે. આ પ્રક્રિયાને Chain of Thought અથવા CoT કહેવામાં આવે છે.
મોટાભાગના મોડલ્સ Explicit CoT નો ઉપયોગ કરે છે. તેઓ જવાબ આપતા પહેલા દરેક વિચારને લખીને દર્શાવે છે. આના કારણે મોડલ ધીમું બને છે. તે ઘણા બધા ટોકન્સનો પણ ઉપયોગ કરે છે.
નવું સંશોધન એક વધુ સારો રસ્તો બતાવે છે. મોડલ્સ Implicit CoT તરફ આગળ વધી શકે છે. આનો અર્થ એ છે કે મોડલ તર્કના સ્ટેપ્સને આંતરિક રીતે (internalize) સમજી લે છે. તે દરેક શબ્દ લખ્યા વિના તર્ક દ્વારા વિચારે છે.
આ ફેરફાર AI કેવી રીતે કામ કરે છે તે બદલી નાખે છે. તે મોડલ્સને ઝડપી બનાવે છે. તે તેમને વધુ કાર્યક્ષમ બનાવે છે.
તે કેવી રીતે કામ કરે છે:
- મોડલ્સ લોજિક પેટર્નનું પાલન કરતા શીખે છે.
- તેઓ તર્કને આઉટપુટમાંથી હિડન લેયર્સ (hidden layers) માં ખસેડે છે.
- મોડલ ઓછા ટેક્સ્ટ સાથે જટિલ સમસ્યાઓ ઉકેલે છે.
આ સ્ટેપ્સને આંતરિક રીતે અપનાવવા માટે મોડલને તાલીમ આપવા માટે ચોક્કસ ડેટા અને પદ્ધતિઓની જરૂર પડે છે. આ મોડલને જનરેશનનો ખર્ચ ઘટાડવાની સાથે ચોકસાઈ જાળવવામાં મદદ કરે છે.
તમારે આ ક્ષેત્ર પર નજીકથી નજર રાખવી જોઈએ. કાર્યક્ષમ તર્ક (Efficient reasoning) એ લાર્જ લેંગ્વેજ મોડલ્સ માટે આગામી પગલું છે.
વૈકલ્પિક લર્નિંગ કોમ્યુનિટી: https://t.me/GyaanSetuAi