CoreWeave, DeepSeek-V3 மூலம் புதிய சாதனையை படைத்துள்ளது
CoreWeave, DeepSeek-V3 ஐ வெறும் 2 நிமிடங்களில் பயிற்றுவித்தது.
இந்த முடிவு புதிய MLPerf v6.0 சாதனையை படைத்துள்ளது. இது முந்தைய AWS சாதனையை விட 43 சதவீதம் சிறந்தது. அதே பணியை முடிக்க AWS 3.5 நிமிடங்கள் எடுத்துக்கொண்டது.
அவர்கள் இதைச் செய்த விதம்:
- 11,000-க்கும் மேற்பட்ட NVIDIA H100 GPUs பயன்படுத்தப்பட்டது.
- பணிச்சுமை (workload) 4 தரவு மையங்களுக்கு (data centers) இடையே பிரிக்கப்பட்டது.
- கணக்கீடுகளை (compute) நிர்வகிக்க ஒரு தனிப்பயனாக்கப்பட்ட orchestration layer பயன்படுத்தப்பட்டது.
CoreWeave, Nvidia Vera Rubin NVL72 ஐ rack scale அளவில் சரிபார்த்தது (validated). இதன் மூலம், இதைச் செய்த முதல் கிளவுட் சேவை வழங்குநராக (cloud provider) அவர்கள் உருவெடுத்துள்ளனர்.
AI துறையில் இதன் முக்கியத்துவம்:
- பல்வேறு இடங்களில் ஆயிரக்கணக்கான GPUs பயன்படுத்தப்படும்போது, பயிற்சி செலவுகள் குறைகின்றன.
- AI பணிச்சுமைகளுக்கு (workloads), பொதுவான கிளவுட் சேவைகளை விட பிரத்யேக உள்கட்டமைப்பு (specialized infrastructure) சிறந்தது.
- DeepSeek-V3, GPT-4 செலவில் ஒரு சிறு பகுதி மட்டுமே செலவில் மிக உயர்ந்த செயல்திறனை வழங்குகிறது.
இந்தத் திறனை விரிவாக்க, CoreWeave தற்போது டெக்சாஸில் (Texas) 1.2 GW தரவு மைய வளாகத்தை (data center campus) உருவாக்கி வருகிறது.
AWS மற்றும் Google Cloud போன்ற பெரிய நிறுவனங்கள் இந்த வேகத்திற்கு எவ்வாறு பதிலளிக்கின்றன என்பதைக் கவனியுங்கள்.
ஆதாரம்: https://dev.to/gentic_news/coreweave-trains-deepseek-v3-in-2-minutes-claims-mlperf-v60-record-3dp4
விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi