𝗖𝗼𝗿𝗲𝗪𝗲𝗮𝘃𝗲 𝗦𝗲𝘁𝘀 𝗡𝗲𝘄 𝗥𝗲𝗰𝗼𝗿𝗱 𝗪𝗶𝘁𝗵 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗩𝟯

📅3 hours ago⏱1 min read

CoreWeave تسجل رقماً قياسياً جديداً مع DeepSeek-V3

قامت CoreWeave بتدريب DeepSeek-V3 في دقيقتين.

تضع هذه النتيجة رقماً قياسياً جديداً في MLPerf v6.0، حيث تتفوق على الرقم القياسي السابق لشركة AWS بنسبة 43%. وقد استغرقت AWS 3.5 دقيقة لإنجاز المهمة نفسها.

كيف حققوا ذلك:

استخدام أكثر من 11,000 من وحدات NVIDIA H100 GPUs.
توزيع عبء العمل عبر 4 مراكز بيانات.
استخدام طبقة تنسيق (orchestration layer) مخصصة لإدارة الحوسبة.

كما قامت CoreWeave أيضاً بالتحقق من كفاءة Nvidia Vera Rubin NVL72 على مستوى الرفوف (rack scale)، مما يجعلها أول مزود خدمات سحابية يقوم بذلك.

لماذا يهم هذا مجال الذكاء الاصطناعي:

تنخفض تكاليف التدريب عند استخدام آلاف من وحدات GPUs عبر مواقع متعددة.
البنية التحتية المتخصصة تتفوق على الخدمات السحابية العامة في أعباء عمل الذكاء الاصطناعي.
يُظهر DeepSeek-V3 أداءً عالياً بتكلفة لا تتجاوز جزءاً بسيطاً من تكاليف GPT-4.

تعمل CoreWeave حالياً على بناء مجمع مراكز بيانات بقدرة 1.2 جيجاوات في تكساس لتوسيع هذه القدرة.

ترقبوا كيف ستستجيب الشركات الكبرى مثل AWS و Google Cloud لهذه السرعات.

المصدر: https://dev.to/gentic_news/coreweave-trains-deepseek-v3-in-2-minutes-claims-mlperf-v60-record-3dp4

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi

𝗖𝗼𝗿𝗲𝗪𝗲𝗮𝘃𝗲 𝗦𝗲𝘁𝘀 𝗡𝗲𝘄 𝗥𝗲𝗰𝗼𝗿𝗱 𝗪𝗶𝘁𝗵 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗩𝟯

Continue reading

𝗪𝗲𝗲𝗸𝗹𝘆 𝗔𝗜 𝗥𝗼𝘂𝗻𝗱𝘂𝗽: 𝗝𝘂𝗻𝗲 𝟬𝟰, 𝟮𝟬𝟮𝟲

DeepSeek تحصل على تمويل ضخم بتقييم مذهل قدره 50 مليار دولار

𝗥𝗔𝗠 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗚𝗣𝗨

الذكاء الاصطناعي صمم واجهة المستخدم الخاصة بي في ساعتين. ثم قضيت 3 أسابيع في إصلاحها.

بوابة الذكاء الاصطناعي: الجهاز العصبي المركزي لنماذج اللغات الكبيرة (LLMs) للمؤسسات