CoreWeave, DeepSeek-V3 ile Yeni Rekor Kırdı
CoreWeave, DeepSeek-V3'ü 2 dakikada eğitti.
Bu sonuç, yeni bir MLPerf v6.0 rekoru kırıyor. Önceki AWS rekorunu yüzde 43 oranında geride bırakıyor. AWS, aynı görevi tamamlamak için 3,5 dakikaya ihtiyaç duymuştu.
Bunu nasıl başardılar:
- 11.000'den fazla NVIDIA H100 GPU kullanıldı.
- İş yükü 4 veri merkezine yayıldı.
- Hesaplamayı yönetmek için özel bir orkestrasyon katmanı kullanıldı.
CoreWeave ayrıca Nvidia Vera Rubin NVL72'yi rack ölçeğinde doğruladı. Bu, onları bunu gerçekleştiren ilk bulut sağlayıcısı yapıyor.
Bu, yapay zeka için neden önemli:
- Binlerce GPU'yu farklı sahalarda kullandığınızda eğitim maliyetleri düşer.
- Özelleşmiş altyapılar, yapay zeka iş yükleri için genel bulut hizmetlerinden daha üstündür.
- DeepSeek-V3, GPT-4 maliyetlerinin çok küçük bir kısmıyla yüksek performans sergiliyor.
CoreWeave, bu kapasiteyi artırmak için şu anda Teksas'ta 1,2 GW'lık bir veri merkezi kampüsü inşa ediyor.
AWS ve Google Cloud gibi büyük oyuncuların bu hızlara nasıl tepki vereceğini izleyin.
Kaynak: https://dev.to/gentic_news/coreweave-trains-deepseek-v3-in-2-minutes-claims-mlperf-v60-record-3dp4
İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi