లిక్విడ్ కూలింగ్ అనేది కొత్త AI ప్రమాణం

NVIDIA Blackwell GPUs భారీ AI పనితీరును అందిస్తాయి. ఇవి లార్జ్ లాంగ్వేజ్ మోడల్స్ మరియు స్వయంప్రతిపత్త రోబోటిక్స్‌కు శక్తిని అందిస్తాయి.

కానీ ఈ GPUలు ఒక పెద్ద సమస్యను సృష్టిస్తాయి: వేడి.

పవర్ డెన్సిటీ పెరిగినప్పుడు సాంప్రదాయ ఎయిర్ కూలింగ్ విఫలమవుతుంది. సాధారణ రాక్‌లు 5 నుండి 15 kW ఉపయోగిస్తాయి. ఆధునిక Blackwell రాక్‌లకు 50 నుండి 120 kW అవసరం. ఈ చిప్‌లను చల్లబరచడానికి గాలి తగినంత వేగంగా కదలలేదు.

లిక్విడ్ కూలింగ్ దీనికి పరిష్కారం. నీరు గాలి కంటే 3,500 రెట్లు ఎక్కువ వేడిని గ్రహిస్తుంది.

AI కోసం మీకు లిక్విడ్ కూలింగ్ ఎందుకు అవసరం:

  • మెరుగైన పనితీరు: ఇది థర్మల్ త్రోటలింగ్‌ను నిరోధిస్తుంది, తద్వారా GPUలు గరిష్ట వేగంతో నడుస్తాయి.
  • అధిక సాంద్రత: మీరు అదే గదిలో ఎక్కువ కంప్యూటింగ్ పవర్‌ను అమర్చవచ్చు.
  • తక్కువ ఖర్చులు: ఇది భారీ ఫ్యాన్లు మరియు AC యూనిట్ల కోసం అవసరమయ్యే శక్తిని తగ్గిస్తుంది.
  • ఎక్కువ హార్డ్‌వేర్ జీవితకాలం: స్థిరమైన ఉష్ణోగ్రతలు భాగాల వైఫల్యాన్ని నివారిస్తాయి.

దీనిని చేయడానికి మూడు ప్రధాన మార్గాలు ఉన్నాయి:

  1. డైరెక్ట్-టు-చిప్: వేడిని నేరుగా బయటకు తీయడానికి GPU పైన కోల్డ్ ప్లేట్లు ఉంటాయి.
  2. రియర్-డోర్ హీట్ ఎక్స్ఛేంజర్లు: ఈ యూనిట్లు రాక్ నుండి వేడి బయటకు వెళ్లేటప్పుడు దానిని గ్రహిస్తాయి.
  3. ఇమ్మర్షన్ కూలింగ్: గరిష్ట కూలింగ్ కోసం సర్వర్లు ప్రత్యేకమైన నాన్-కండక్టివ్ ఫ్లూయిడ్‌లో ఉంటాయి.

లిక్విడ్ కూలింగ్‌కు మారడానికి ప్రణాళిక అవసరం. మీరు ఫ్లోర్ బరువు, వాటర్ సిస్టమ్స్ మరియు పవర్ సామర్థ్యాన్ని తనిఖీ చేయాలి. దీనికి ప్రారంభంలో ఖర్చు ఎక్కువ అవుతుంది, కానీ నిర్వహణలో కలిగే ఆదా దీనికి తగినంత విలువను ఇస్తుంది.

ఎయిర్-కూల్డ్ AI యుగం ముగిసిపోతోంది. హై-పెర్ఫార్మెన్స్ ఇన్‌ఫ్రాస్ట్రక్చర్ కోసం లిక్విడ్ కూలింగ్ ఇప్పుడు ఒక అనివార్యం.

మూలం: https://dev.to/cyfutureai/liquid-cooled-data-centers-for-nvidia-blackwell-gpu-deployments-the-future-of-high-performance-ai-dll

ఐచ్ఛిక అభ్యాస సమూహం: https://t.me/GyaanSetuAi