𝗙𝗿𝗼𝗺 𝗘𝘅𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧 𝘁𝗼 𝗜𝗺𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧

📅1 hour ago⏱1 min read

Od jawnego CoT do niejawnego CoT

Modele AI rozwiązują trudne problemy, myśląc krok po kroku. Proces ten nazywany jest Chain of Thought lub CoT.

Większość modeli korzysta z jawnego CoT (Explicit CoT). Zapisują one każdą pojedynczą myśl przed udzieleniem odpowiedzi. Powoduje to, że model działa wolniej. Zużywa on również wiele tokenów.

Nowe badania wskazują na lepsze rozwiązanie. Modele mogą przejść na niejawne CoT (Implicit CoT). Oznacza to, że model internalizuje kroki rozumowania. Przetwarza logikę wewnątrz siebie, nie zapisując każdego słowa.

Ta zmiana zmienia sposób działania AI. Sprawia, że modele są szybsze i bardziej wydajne.

Jak to działa:

Modele uczą się podążać za wzorcami logicznymi.
Przenoszą one rozumowanie z wyjścia do warstw ukrytych.
Model rozwiązuje złożone problemy przy użyciu mniejszej ilości tekstu.

Trenowanie modelu w celu internalizacji tych kroków wymaga specyficznych danych i metod. Pomaga to modelowi zachować dokładność przy jednoczesnym obniżeniu kosztów generowania.

Warto uważnie obserwować tę dziedzinę. Wydajne rozumowanie to kolejny krok dla dużych modeli językowych.

Źródło: https://dev.to/paperium/from-explicit-cot-to-implicit-cot-learning-to-internalize-cot-step-by-step-b59

Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi

𝗙𝗿𝗼𝗺 𝗘𝘅𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧 𝘁𝗼 𝗜𝗺𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

Nie pozwól, by AI myślało za Ciebie

AI to coś więcej niż tylko prompty

𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝗜𝘀 𝗧𝗵𝗲 𝗠𝗼𝘀𝘁 𝗛𝗼𝗻𝗲𝘀𝘁 𝗣𝗮𝗿𝘁 𝗢𝗳 𝗔𝗜

𝗔𝗜 𝗢𝗻𝗹𝘆 𝗪𝗼𝗿𝗸𝘀 𝗜𝗳 𝗬𝗼𝘂 𝗛𝗮𝘃𝗲 𝗙𝗮𝗰𝗲𝗱 𝗧𝗵𝗲 𝗦𝘁𝗿𝘂𝗴𝗴𝗹𝗲