Açık CoT'tan Örtük CoT'a
Yapay zeka modelleri zor problemleri adım adım düşünerek çözer. Bu sürece Chain of Thought (Düşünce Zinciri) veya CoT denir.
Çoğu model Açık (Explicit) CoT kullanır. Bir cevap vermeden önce her bir düşünceyi tek tek yazarlar. Bu, modeli yavaşlatır. Ayrıca çok fazla token kullanır.
Yeni araştırmalar daha iyi bir yol gösteriyor. Modeller Örtük (Implicit) CoT'a geçebilir. Bu, modelin akıl yürütme adımlarını içselleştirmesi anlamına gelir. Her kelimeyi yazmaya gerek duymadan mantık yürüterek düşünür.
Bu değişim yapay zekanın çalışma şeklini değiştiriyor. Modelleri daha hızlı hale getiriyor. Onları daha verimli kılıyor.
Nasıl çalışır:
- Modeller mantık kalıplarını takip etmeyi öğrenir.
- Akıl yürütmeyi çıktıdan gizli katmanlara (hidden layers) taşırlar.
- Model, karmaşık problemleri daha az metinle çözer.
Bir modeli bu adımları içselleştirmesi için eğitmek, özel veri ve yöntemler gerektirir. Bu, modelin üretim maliyetini düşürürken doğruluğunu korumasına yardımcı olur.
Bu alanı yakından takip etmelisiniz. Verimli akıl yürütme, büyük dil modelleri için bir sonraki adımdır.
İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi