𝗖𝗼𝗿𝗲𝗪𝗲𝗮𝘃𝗲 𝗦𝗲𝘁𝘀 𝗡𝗲𝘄 𝗥𝗲𝗰𝗼𝗿𝗱 𝗪𝗶𝘁𝗵 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸-𝗩𝟯
CoreWeave, DeepSeek-V3 ಅನ್ನು ಕೇವಲ 2 ನಿಮಿಷಗಳಲ್ಲಿ ತರಬೇತಿಗೊಳಿಸಿತು.
ಈ ಫಲಿತಾಂಶವು ಹೊಸ MLPerf v6.0 ದಾಖಲೆಯನ್ನು ನಿರ್ಮಿಸಿದೆ. ಇದು ಹಿಂದಿನ AWS ದಾಖಲೆಗಿಂತ ಶೇಕಡಾ 43 ರಷ್ಟು ವೇಗವಾಗಿದೆ. ಅದೇ ಕೆಲಸವನ್ನು ಪೂರ್ಣಗೊಳಿಸಲು AWS ಗೆ 3.5 ನಿಮಿಷಗಳು ಬೇಕಾಗಿದ್ದವು.
ಅವರು ಇದನ್ನು ಹೇಗೆ ಮಾಡಿದರು:
- 11,000 ಕ್ಕೂ ಹೆಚ್ಚು NVIDIA H100 GPUs ಬಳಸಿದ್ದಾರೆ.
- ಕೆಲಸದ ಹೊರೆಯನ್ನು (workload) 4 ಡೇಟಾ ಸೆಂಟರ್ಗಳಾದ್ಯಂತ ಹಂಚಿಕೆ ಮಾಡಿದರು.
- ಕಂಪ್ಯೂಟ್ ಅನ್ನು ನಿರ್ವಹಿಸಲು ಕಸ್ಟಮ್ ಆರ್ಕೆಸ್ಟ್ರೇಶನ್ ಲೇಯರ್ (custom orchestration layer) ಬಳಸಿದ್ದಾರೆ.
CoreWeave, Nvidia Vera Rubin NVL72 ಅನ್ನು ರ್ಯಾಕ್ ಸ್ಕೇಲ್ನಲ್ಲಿ (rack scale) ಪರಿಶೀಲಿಸಿದೆ. ಇದು ಅಂತಹ ಕೆಲಸ ಮಾಡಿದ ಮೊದಲ ಕ್ಲೌಡ್ ಪ್ರೊವೈಡರ್ ಆಗಿ ಅವರನ್ನು ಮಾಡಿದೆ.
ಇದು AI ಗೆ ಏಕೆ ಮುಖ್ಯ:
- ವಿವಿಧ ಸ್ಥಳಗಳಲ್ಲಿ ಸಾವಿರಾರು GPUs ಬಳಸಿದಾಗ ತರಬೇತಿ ವೆಚ್ಚಗಳು ಕಡಿಮೆಯಾಗುತ್ತವೆ.
- AI ವರ್ಕ್ಲೋಡ್ಗಳಿಗಾಗಿ ವಿಶೇಷ ಮೂಲಸೌಕರ್ಯಗಳು ಸಾಮಾನ್ಯ ಕ್ಲೌಡ್ ಸೇವೆಗಳಿಗಿಂತ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ.
- DeepSeek-V3, GPT-4 ವೆಚ್ಚದ ಒಂದು ಸಣ್ಣ ಭಾಗದಲ್ಲಿ ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ತೋರಿಸುತ್ತದೆ.
CoreWeave ಈ ಸಾಮರ್ಥ್ಯವನ್ನು ವಿಸ್ತರಿಸಲು ಟೆಕ್ಸಾಸ್ನಲ್ಲಿ 1.2 GW ಡೇಟಾ ಸೆಂಟರ್ ಕ್ಯಾಂಪಸ್ ಅನ್ನು ನಿರ್ಮಿಸುತ್ತಿದೆ.
AWS ಮತ್ತು Google Cloud ನಂತಹ ದೊಡ್ಡ ಸಂಸ್ಥೆಗಳು ಈ ವೇಗಕ್ಕೆ ಹೇಗೆ ಪ್ರತಿಕ್ರಿಯಿಸುತ್ತವೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ.
ಮೂಲ: https://dev.to/gentic_news/coreweave-trains-deepseek-v3-in-2-minutes-claims-mlperf-v60-record-3dp4
ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi