𝗖𝗼𝗿𝗲𝗪𝗲𝗮𝘃𝗲 એ DeepSeek-V3 સાથે નવો રેકોર્ડ બનાવ્યો
CoreWeave એ DeepSeek-V3 ને માત્ર 2 મિનિટમાં તાલીમ આપી.
આ પરિણામ MLPerf v6.0 નો નવો રેકોર્ડ સ્થાપિત કરે છે. તે અગાઉના AWS રેકોર્ડ કરતા 43 ટકા વધુ ઝડપી છે. AWS ને આ જ કાર્ય પૂર્ણ કરવામાં 3.5 મિનિટ લાગી હતી.
તેમણે આ કેવી રીતે કર્યું:
- 11,000 થી વધુ NVIDIA H100 GPUs નો ઉપયોગ કર્યો.
- 4 ડેટા સેન્ટર્સમાં વર્કલોડ વિતરિત કર્યો.
- કમ્પ્યુટ મેનેજ કરવા માટે કસ્ટમ ઓર્કેસ્ટ્રેશન લેયરનો ઉપયોગ કર્યો.
CoreWeave એ rack સ્કેલ પર Nvidia Vera Rubin NVL72 ને પણ વેલિડેટ કર્યું છે. આ સાથે તેઓ આવું કરનાર પ્રથમ ક્લાઉડ પ્રોવાઈડર બન્યા છે.
AI માટે આ શા માટે મહત્વનું છે:
- જ્યારે તમે વિવિધ સાઇટ્સ પર હજારો GPUs નો ઉપયોગ કરો છો, ત્યારે તાલીમ ખર્ચ ઘટે છે.
- AI વર્કલોડ માટે સ્પેશિયલાઇઝ્ડ ઇન્ફ્રાસ્ટ્રક્ચર સામાન્ય ક્લાઉડ સેવાઓ કરતા વધુ સારું પરિણામ આપે છે.
- DeepSeek-V3 એ GPT-4 ના ખર્ચના માત્ર એક નાના ભાગમાં ઉચ્ચ પ્રદર્શન દર્શાવે છે.
CoreWeave હવે આ ક્ષમતા વધારવા માટે ટેક્સાસમાં 1.2 GW ડેટા સેન્ટર કેમ્પસ બનાવી રહ્યું છે.
જુઓ કે AWS અને Google Cloud જેવા મોટા ખેલાડીઓ આ ઝડપ સામે કેવી પ્રતિક્રિયા આપે છે.
સ્ત્રોત: https://dev.to/gentic_news/coreweave-trains-deepseek-v3-in-2-minutes-claims-mlperf-v60-record-3dp4
વૈકલ્પિક લર્નિંગ કોમ્યુનિટી: https://t.me/GyaanSetuAi