𝗖𝗼𝗿𝗲𝗪𝗲𝗮𝘃𝗲 𝗦𝗲𝘁𝘀 𝗡𝗲𝘄 𝗥𝗲𝗰𝗼𝗿𝗱 𝗪𝗶𝘁𝗵 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗩𝟯

📅3 hours ago⏱1 min read

𝗖𝗼𝗿𝗲𝗪𝗲𝗮𝘃𝗲 𝗦𝗲𝘁𝘀 𝗡𝗲𝘄 𝗥𝗲𝗰𝗼𝗿𝗱 𝗪𝗶𝘁𝗵 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸-𝗩𝟯

CoreWeave, DeepSeek-V3 ಅನ್ನು ಕೇವಲ 2 ನಿಮಿಷಗಳಲ್ಲಿ ತರಬೇತಿಗೊಳಿಸಿತು.

ಈ ಫಲಿತಾಂಶವು ಹೊಸ MLPerf v6.0 ದಾಖಲೆಯನ್ನು ನಿರ್ಮಿಸಿದೆ. ಇದು ಹಿಂದಿನ AWS ದಾಖಲೆಗಿಂತ ಶೇಕಡಾ 43 ರಷ್ಟು ವೇಗವಾಗಿದೆ. ಅದೇ ಕೆಲಸವನ್ನು ಪೂರ್ಣಗೊಳಿಸಲು AWS ಗೆ 3.5 ನಿಮಿಷಗಳು ಬೇಕಾಗಿದ್ದವು.

ಅವರು ಇದನ್ನು ಹೇಗೆ ಮಾಡಿದರು:

11,000 ಕ್ಕೂ ಹೆಚ್ಚು NVIDIA H100 GPUs ಬಳಸಿದ್ದಾರೆ.
ಕೆಲಸದ ಹೊರೆಯನ್ನು (workload) 4 ಡೇಟಾ ಸೆಂಟರ್‌ಗಳಾದ್ಯಂತ ಹಂಚಿಕೆ ಮಾಡಿದರು.
ಕಂಪ್ಯೂಟ್ ಅನ್ನು ನಿರ್ವಹಿಸಲು ಕಸ್ಟಮ್ ಆರ್ಕೆಸ್ಟ್ರೇಶನ್ ಲೇಯರ್ (custom orchestration layer) ಬಳಸಿದ್ದಾರೆ.

CoreWeave, Nvidia Vera Rubin NVL72 ಅನ್ನು ರ್ಯಾಕ್ ಸ್ಕೇಲ್‌ನಲ್ಲಿ (rack scale) ಪರಿಶೀಲಿಸಿದೆ. ಇದು ಅಂತಹ ಕೆಲಸ ಮಾಡಿದ ಮೊದಲ ಕ್ಲೌಡ್ ಪ್ರೊವೈಡರ್ ಆಗಿ ಅವರನ್ನು ಮಾಡಿದೆ.

ಇದು AI ಗೆ ಏಕೆ ಮುಖ್ಯ:

ವಿವಿಧ ಸ್ಥಳಗಳಲ್ಲಿ ಸಾವಿರಾರು GPUs ಬಳಸಿದಾಗ ತರಬೇತಿ ವೆಚ್ಚಗಳು ಕಡಿಮೆಯಾಗುತ್ತವೆ.
AI ವರ್ಕ್‌ಲೋಡ್‌ಗಳಿಗಾಗಿ ವಿಶೇಷ ಮೂಲಸೌಕರ್ಯಗಳು ಸಾಮಾನ್ಯ ಕ್ಲೌಡ್ ಸೇವೆಗಳಿಗಿಂತ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ.
DeepSeek-V3, GPT-4 ವೆಚ್ಚದ ಒಂದು ಸಣ್ಣ ಭಾಗದಲ್ಲಿ ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ತೋರಿಸುತ್ತದೆ.

CoreWeave ಈ ಸಾಮರ್ಥ್ಯವನ್ನು ವಿಸ್ತರಿಸಲು ಟೆಕ್ಸಾಸ್‌ನಲ್ಲಿ 1.2 GW ಡೇಟಾ ಸೆಂಟರ್ ಕ್ಯಾಂಪಸ್ ಅನ್ನು ನಿರ್ಮಿಸುತ್ತಿದೆ.

AWS ಮತ್ತು Google Cloud ನಂತಹ ದೊಡ್ಡ ಸಂಸ್ಥೆಗಳು ಈ ವೇಗಕ್ಕೆ ಹೇಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುತ್ತವೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ.

ಮೂಲ: https://dev.to/gentic_news/coreweave-trains-deepseek-v3-in-2-minutes-claims-mlperf-v60-record-3dp4

ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi

𝗖𝗼𝗿𝗲𝗪𝗲𝗮𝘃𝗲 𝗦𝗲𝘁𝘀 𝗡𝗲𝘄 𝗥𝗲𝗰𝗼𝗿𝗱 𝗪𝗶𝘁𝗵 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗩𝟯

Continue reading

𝗪𝗲𝗲𝗸𝗹𝘆 𝗔𝗜 𝗥𝗼𝘂𝗻𝗱𝘂𝗽: 𝗝𝘂𝗻𝗲 𝟬𝟰, 𝟮𝟬𝟮𝟲

DeepSeek Secures Massive Funding at a Staggering $50 Billion Valuation

RAM ಈಗ ಹೊಸ GPU

AI ನನ್ನ UI ಅನ್ನು 2 ಗಂಟೆಗಳಲ್ಲಿ ನಿರ್ಮಿಸಿತು. ನಂತರ ಅದನ್ನು ಸರಿಪಡಿಸಲು ನಾನು 3 ವಾರಗಳನ್ನು ಕಳೆದೆನು.

𝗔𝗜 𝗚𝗮𝘁𝗲𝘄𝗮𝘆: 𝗧𝗵𝗲 𝗖𝗲𝗻𝘁𝗿𝗮𝗹 𝗡𝗲𝗿𝘃𝗼𝘂𝘀 𝗦𝘆𝘀𝘁𝗲𝗺 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗟𝗟𝗠𝘀