𝗖𝗼𝗿𝗲𝗪𝗲𝗮𝘃𝗲 𝗦𝗲𝘁𝘀 𝗡𝗲𝘄 𝗥𝗲𝗰𝗼𝗿𝗱 𝗪𝗶𝘁𝗵 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗩𝟯

📅3 hours ago⏱1 min read

CoreWeave, DeepSeek-V3 ile Yeni Rekor Kırdı

CoreWeave, DeepSeek-V3'ü 2 dakikada eğitti.

Bu sonuç, yeni bir MLPerf v6.0 rekoru kırıyor. Önceki AWS rekorunu yüzde 43 oranında geride bırakıyor. AWS, aynı görevi tamamlamak için 3,5 dakikaya ihtiyaç duymuştu.

Bunu nasıl başardılar:

11.000'den fazla NVIDIA H100 GPU kullanıldı.
İş yükü 4 veri merkezine yayıldı.
Hesaplamayı yönetmek için özel bir orkestrasyon katmanı kullanıldı.

CoreWeave ayrıca Nvidia Vera Rubin NVL72'yi rack ölçeğinde doğruladı. Bu, onları bunu gerçekleştiren ilk bulut sağlayıcısı yapıyor.

Bu, yapay zeka için neden önemli:

Binlerce GPU'yu farklı sahalarda kullandığınızda eğitim maliyetleri düşer.
Özelleşmiş altyapılar, yapay zeka iş yükleri için genel bulut hizmetlerinden daha üstündür.
DeepSeek-V3, GPT-4 maliyetlerinin çok küçük bir kısmıyla yüksek performans sergiliyor.

CoreWeave, bu kapasiteyi artırmak için şu anda Teksas'ta 1,2 GW'lık bir veri merkezi kampüsü inşa ediyor.

AWS ve Google Cloud gibi büyük oyuncuların bu hızlara nasıl tepki vereceğini izleyin.

Kaynak: https://dev.to/gentic_news/coreweave-trains-deepseek-v3-in-2-minutes-claims-mlperf-v60-record-3dp4

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi

𝗖𝗼𝗿𝗲𝗪𝗲𝗮𝘃𝗲 𝗦𝗲𝘁𝘀 𝗡𝗲𝘄 𝗥𝗲𝗰𝗼𝗿𝗱 𝗪𝗶𝘁𝗵 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗩𝟯

Continue reading

𝗪𝗲𝗲𝗸𝗹𝘆 𝗔𝗜 𝗥𝗼𝘂𝗻𝗱𝘂𝗽: 𝗝𝘂𝗻𝗲 𝟬𝟰, 𝟮𝟬𝟮𝟲

DeepSeek Secures Massive Funding at a Staggering $50 Billion Valuation

𝗥𝗔𝗠 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗚𝗣𝗨

𝗔𝗜 𝗕𝘂𝗶𝗹𝘁 𝗠𝘆 𝗨𝗜 𝗶𝗻 𝟮 𝗛𝗼𝘂𝗿𝘀. 𝗧𝗵𝗲𝗻 𝗜 𝗦𝗽𝗲𝗻𝘁 𝟯 𝗪𝗲𝗲𝗸𝘀 𝗙𝗶𝘅𝗶𝗻𝗴 𝗜𝘁.

𝗔𝗜 𝗚𝗮𝘁𝗲𝘄𝗮𝘆: 𝗧𝗵𝗲 𝗖𝗲𝗻𝘁𝗿𝗮𝗹 𝗡𝗲𝗿𝘃𝗼𝘂𝘀 𝗦𝘆𝘀𝘁𝗲𝗺 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗟𝗟𝗠𝘀