General Intuition, Gerçek Dünyadaki Yapay Zekayı İnşa Etmek İçin Video Oyunlarını Nasıl Kullanıyor

General Intuition, fiziksel dünya için ajan modelleri eğitmek amacıyla devasa video oyunu veri setlerini kullanarak robotikte büyük bir paradigma değişimi gerçekleştirmeye çalışıyor. Yeni bir 320 milyon dolarlık yatırım turuyla startup, oyunlarda bulunan "eylem verilerinin" (action data) yapay zeka için eksik olan halka olduğuna inanıyor.

Eylem Etiketlerinin ve Uzamsal-Zamansal Akıl Yürütmenin Gücü

Birçok yapay zeka araştırmacısı modelleri sadece video görüntülerini gözlemleyerek eğitmeye çalışırken, General Intuition CEO'su Pim de Witte, videonun tek başına yetersiz olduğunu savunuyor. Şirketin rekabet avantajı, kullanıcıların video oyunu kliplerini paylaştığı bir platform olan Medal'dan elde edilen tescilli verilere erişiminde yatıyor.

Standart videolardan farklı olarak bu klipler, gömülü "eylem etiketleri" (action labels) içerir; yani bir oyuncunun hangi düğmelere tam olarak ne zaman bastığının kesin kayıtlarıdır. Bu, modelin yalnızca örüntü tanıma aşamasını geçmesini sağlar; model uzamsal-zamansal akıl yürütmeyi öğrenir. Belirli bir girdi (bir eylem) ile ortamda meydana gelen sonuç (tepki) arasındaki doğrudan bağlantıyı anlayarak, yapay zeka nedenselliği kavramaya başlar. Bu durum, modelin herhangi bir otonom ajan için temel bir gereklilik olan "benlik" ile "çevreyi" birbirinden ayırt etmesine olanak tanır.

Fortnite'tan Dört Bacaklı Robotlara

Şirketin teknik hedefi; oynanış, simülasyon ve fiziksel somutlaşma gibi farklı alanlarda genelleme yapabilen tek bir model oluşturmaktır. Son gösterimlerde, oynanış üzerine eğitilmiş bir yapay zeka ajanı; duvarların katı nesneler olduğunu ve gölgelerin güneşin hareketiyle değiştiğini anlayarak karmaşık sanal ortamlarda yol almayı başardı.

En önemlisi, bu "beyin" doğrudan donanıma aktarılıyor. Şirket, oyun ajanlarına güç veren aynı modeli kullanan dört bacaklı bir robot sergiledi. Dikkat çekici bir şekilde ekip, robotun navigasyonu için modeli ince ayar yapmanın (fine-tune), gerçek sokaklarda toplanan sadece sekiz dakikalık gerçek dünya robotik verisiyle mümkün olduğunu bildirdi. Bu durum, fizik ve uzamsal farkındalık öğrenme gibi ağır iş yükünün video oyunlarının "spor salonunda" yapıldığını ve bunun da gerçek dünya uygulamalarını önemli ölçüde daha verimli hale getirdiğini gösteriyor.

Genel Ajanlar Üzerine 2,3 Milyar Dolarlık Bir Bahis

Bu hırsın boyutu şirketin değerlemesine de yansıyor. General Intuition kısa süre önce 2,3 milyar dolar değerleme ile 320 milyon dolar yatırım topladı ve böylece açıklanan toplam finansmanı 454 milyon dolara ulaştı. Yatırım turuna Khosla Ventures liderlik ederken; General Catalyst, Jeff Bezos, Eric Schmidt ile Google DeepMind ve MIT'den araştırmacılar da önemli katılım sağladı.

Sermaye iki temel amaç için ayrıldı: CoreWeave ile yapılan ortaklık aracılığıyla hesaplama kapasitesini ölçeklendirmek ve API'larını yaz sonuna kadar daha geniş çapta erişilebilir hale getirmek. Vinod Khosla gibi yatırımcılar için hedef sadece daha iyi bir otomasyon değil, "yapay zeka sezgisi"nin (AI intuition) ortaya çıkmasıdır; yani sadece programlanmış talimatları izlemek yerine, dünyayı anlayarak yönetebilen insan benzeri bir yetenek.

Önemli Çıkarımlar

  • Eylem Odaklı Eğitim: General Intuition, sadece video ile eğitim yapmanın sınırlamalarını aşarak, yapay zekaya nedenselliği öğretmek için oyun kliplerindeki düğme basma "eylem etiketlerini" kullanıyor.
  • Ölçeklenebilir Simülasyon: Şirket, video oyunlarını bir "spor salonu" olarak kullanarak, gerçek dünya robotik verilerini toplamanın getireceği devasa maliyetlere katlanmadan karmaşık uzamsal-zamansal akıl yürütme eğitimi verebiliyor.
  • Devasa Kurumsal Destek: 2,3 milyar dolarlık değerlemesi ve Jeff Bezos ile Eric Schmidt gibi isimlerin desteğiyle şirket, dünya modeli (world model) çağında temel bir oyuncu olarak konumlanıyor.