LLM'ler vs. Üretken Yapay Zeka

Üretken Yapay Zeka geniş bir terimdir. LLM'ler bu grup içindeki belirli bir model türüdür. Daha iyi sistemler inşa etmek için teknik farkları anlamanız gerekir.

LLM'ler bir sonraki token'ı tahmin etmek için Transformer'ları kullanır. Otoregresif süreçler aracılığıyla çalışırlar.

Bir LLM nasıl çalışır:

  • Model bir istem (prompt) alır.
  • Metni token'lara dönüştürür.
  • Bir sonraki token'ın olasılığını hesaplar.
  • Cümleler oluşturmak için bu döngüyü tekrarlar.

Difüzyon modelleri farklı çalışır. Gürültüyü tersine çevirerek görüntüler oluştururlar.

Bir Difüzyon modeli nasıl çalışır:

  • Sistem rastgele gürültü ile başlar.
  • Gürültüyü adım adım kaldırır.
  • Bir görüntüyü ortaya çıkarmak için bir deseni takip eder.
  • Gürültü giderme işlemini yönlendirmek için istemleri (prompt) kullanır.

Hızlı bir karşılaştırma: • LLM: Otoregresif Transformer'lar kullanır. Çıktı metin token'larıdır. • Difüzyon: Yinelemeli gürültü giderme kullanır. Çıktı piksellerdir. • GAN: Çekişmeli (adversarial) eğitim kullanır. Çıktı sentetik verilerdir.

Bu modeller arasındaki sınır değişiyor. Çoğu modern sistem artık Transformer omurgalarını kullanıyor. Mimari bileşimsel (compositional) hale geliyor. Bu, farklı model türlerinin tek bir sistemde birlikte çalışacağı anlamına geliyor.

Kaynak: https://dev.to/aljen_007/llms-vs-generative-ai-7gc