LLM'lerde Bilimsel Zekayı İncelemek
Araştırmacılar, Büyük Dil Modellerinin bilimsel zekaya sahip olup olmadığını bilmek istiyor.
Çoğu test basit gerçeklere odaklanıyor. Bu çalışma, gerçek bilim insanlarının çalışma şekliyle uyumlu iş akışlarını kullanıyor.
Araştırmacılar, modellerin karmaşık bilimsel akıl yürütme süreçlerini nasıl yönettiğini test etti.
Temel bulgular:
- Mevcut modeller uzun bilimsel iş akışlarında zorlanıyor.
- Çok adımlı süreçlerde akıl yürütme hataları meydana geliyor.
- Bilimsel yöntemlerle uyum, doğruluğu artırıyor.
Araştırmalarda yapay zekanın sınırlarını anlamak için bu iş akışlarına bakmalısınız. Standart kıyaslama testleri resmin tamamını göstermiyor.
İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi