திரவக் குளிர்விப்புதான் புதிய AI தரநிலை
NVIDIA Blackwell GPUs மிகப்பெரிய AI செயல்திறனை வழங்குகின்றன. இவை பெரிய மொழி மாதிரிகள் (large language models) மற்றும் தன்னாட்சி ரோபோட்டிக்ஸ் (autonomous robotics) ஆகியவற்றிற்கு ஆற்றலை வழங்குகின்றன.
ஆனால் இந்த GPUs ஒரு மிகப்பெரிய சிக்கலை உருவாக்குகின்றன: வெப்பம்.
மின் அடர்த்தி (power density) அதிகரிக்கும் போது பாரம்பரிய காற்று குளிர்விப்பு (air cooling) தோல்வியடைகிறது. சாதாரண ரேக்குகள் (racks) 5 முதல் 15 kW வரை பயன்படுத்துகின்றன. நவீன Blackwell ரேக்குகளுக்கு 50 முதல் 120 kW தேவைப்படுகிறது. இந்த சிப்களைக் குளிர்விக்க காற்று போதுமான வேகத்தில் நகர முடியாது.
திரவக் குளிர்விப்புதான் இதற்கான தீர்வு. காற்றுடன் ஒப்பிடும்போது நீர் 3,500 மடங்கு அதிக வெப்பத்தை உறிஞ்சுகிறது.
AI-க்கு உங்களுக்கு ஏன் திரவக் குளிர்விப்பு தேவைப்படுகிறது:
- சிறந்த செயல்திறன்: இது வெப்பத் தடையைத் (thermal throttling) தடுத்து, GPUs உச்ச வேகத்தில் இயங்குவதை உறுதி செய்கிறது.
- அதிக அடர்த்தி: ஒரே அறையில் அதிக கணினித் திறனை (computing power) உங்களால் பொருத்த முடியும்.
- குறைந்த செலவு: இது பெரிய விசிறிகள் மற்றும் AC அலகுகளுக்குத் தேவைப்படும் ஆற்றலைக் குறைக்கிறது.
- நீண்ட கால வன்பொருள் ஆயுள்: நிலையான வெப்பநிலை கூறுகளின் செயலிழப்பைத் தடுக்கிறது.
இதைச் செய்வதற்கு மூன்று முக்கிய வழிகள் உள்ளன:
- Direct-to-chip: வெப்பத்தை நேரடியாக வெளியேற்ற GPU-வின் மேல் கோல்ட் பிளேட்டுகள் (cold plates) பொருத்தப்படுகின்றன.
- Rear-door heat exchangers: இந்த அலகுகள் ரேக்கிலிருந்து வெப்பம் வெளியேறும் போது அதைச் சேகரிக்கின்றன.
- Immersion cooling: அதிகபட்ச குளிர்விப்பிற்காக சர்வர்கள் சிறப்பு மின்சாரத்தைக் கடத்தாத திரவத்தில் (non-conductive fluid) வைக்கப்படுகின்றன.
திரவக் குளிர்விப்பிற்கு மாறுவதற்குத் திட்டமிடல் அவசியம். தரை எடை, நீர் அமைப்புகள் மற்றும் மின் திறன் ஆகியவற்றை நீங்கள் சரிபார்க்க வேண்டும். இதற்கு ஆரம்பத்தில் அதிக செலவாகும், ஆனால் செயல்பாட்டுச் சேமிப்பு (operational savings) அதற்குப் போதுமானதாக இருக்கும்.
காற்று மூலம் குளிர்விக்கப்படும் AI-ன் காலம் முடிவுக்கு வருகிறது. உயர் செயல்திறன் கொண்ட உள்கட்டமைப்பிற்கு (high-performance infrastructure) திரவக் குளிர்விப்பு இப்போது ஒரு அவசியமாகும்.
Optional learning community: https://t.me/GyaanSetuAi