𝗖𝗼𝗿𝗲𝗪𝗲𝗮𝘃𝗲 𝗦𝗲𝘁𝘀 𝗡𝗲𝘄 𝗥𝗲𝗰𝗼𝗿𝗱 𝗪𝗶𝘁𝗵 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗩𝟯

📅3 hours ago⏱1 min read

CoreWeave, DeepSeek-V3 மூலம் புதிய சாதனையை படைத்துள்ளது

CoreWeave, DeepSeek-V3 ஐ வெறும் 2 நிமிடங்களில் பயிற்றுவித்தது.

இந்த முடிவு புதிய MLPerf v6.0 சாதனையை படைத்துள்ளது. இது முந்தைய AWS சாதனையை விட 43 சதவீதம் சிறந்தது. அதே பணியை முடிக்க AWS 3.5 நிமிடங்கள் எடுத்துக்கொண்டது.

அவர்கள் இதைச் செய்த விதம்:

11,000-க்கும் மேற்பட்ட NVIDIA H100 GPUs பயன்படுத்தப்பட்டது.
பணிச்சுமை (workload) 4 தரவு மையங்களுக்கு (data centers) இடையே பிரிக்கப்பட்டது.
கணக்கீடுகளை (compute) நிர்வகிக்க ஒரு தனிப்பயனாக்கப்பட்ட orchestration layer பயன்படுத்தப்பட்டது.

CoreWeave, Nvidia Vera Rubin NVL72 ஐ rack scale அளவில் சரிபார்த்தது (validated). இதன் மூலம், இதைச் செய்த முதல் கிளவுட் சேவை வழங்குநராக (cloud provider) அவர்கள் உருவெடுத்துள்ளனர்.

AI துறையில் இதன் முக்கியத்துவம்:

பல்வேறு இடங்களில் ஆயிரக்கணக்கான GPUs பயன்படுத்தப்படும்போது, பயிற்சி செலவுகள் குறைகின்றன.
AI பணிச்சுமைகளுக்கு (workloads), பொதுவான கிளவுட் சேவைகளை விட பிரத்யேக உள்கட்டமைப்பு (specialized infrastructure) சிறந்தது.
DeepSeek-V3, GPT-4 செலவில் ஒரு சிறு பகுதி மட்டுமே செலவில் மிக உயர்ந்த செயல்திறனை வழங்குகிறது.

இந்தத் திறனை விரிவாக்க, CoreWeave தற்போது டெக்சாஸில் (Texas) 1.2 GW தரவு மைய வளாகத்தை (data center campus) உருவாக்கி வருகிறது.

AWS மற்றும் Google Cloud போன்ற பெரிய நிறுவனங்கள் இந்த வேகத்திற்கு எவ்வாறு பதிலளிக்கின்றன என்பதைக் கவனியுங்கள்.

ஆதாரம்: https://dev.to/gentic_news/coreweave-trains-deepseek-v3-in-2-minutes-claims-mlperf-v60-record-3dp4

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi

𝗖𝗼𝗿𝗲𝗪𝗲𝗮𝘃𝗲 𝗦𝗲𝘁𝘀 𝗡𝗲𝘄 𝗥𝗲𝗰𝗼𝗿𝗱 𝗪𝗶𝘁𝗵 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗩𝟯

Continue reading

𝗪𝗲𝗲𝗸𝗹𝘆 𝗔𝗜 𝗥𝗼𝘂𝗻𝗱𝘂𝗽: 𝗝𝘂𝗻𝗲 𝟬𝟰, 𝟮𝟬𝟮𝟲

DeepSeek Secures Massive Funding at a Staggering $50 Billion Valuation

RAM தான் புதிய GPU

AI எனது UI-ஐ 2 மணிநேரத்தில் உருவாக்கியது. பிறகு அதைச் சரிசெய்ய நான் 3 வாரங்களைச் செலவிட்டேன்.

𝗔𝗜 𝗚𝗮𝘁𝗲𝘄𝗮𝘆: 𝗧𝗵𝗲 𝗖𝗲𝗻𝘁𝗿𝗮𝗹 𝗡𝗲𝗿𝘃𝗼𝘂𝘀 𝗦𝘆𝘀𝘁𝗲𝗺 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗟𝗟𝗠𝘀