لیکویڈ کولنگ اب AI کا نیا معیار ہے
NVIDIA Blackwell GPUs زبردست AI کارکردگی فراہم کرتے ہیں۔ یہ بڑے لینگویج ماڈلز اور خود مختار روبوٹکس کو طاقت فراہم کرتے ہیں۔
لیکن یہ GPUs ایک بڑا مسئلہ پیدا کرتے ہیں: حرارت۔
جب پاور ڈینسٹی (power density) بڑھتی ہے تو روایتی ایئر کولنگ ناکام ہو جاتی ہے۔ معیاری ریک 5 سے 15 kW استعمال کرتے ہیں۔ جدید Blackwell ریک کو 50 سے 120 kW کی ضرورت ہوتی ہے۔ ہوا ان چپس کو ٹھنڈا کرنے کے لیے اتنی تیزی سے حرکت نہیں کر سکتی۔
لیکویڈ کولنگ ہی اس کا حل ہے۔ پانی ہوا کے مقابلے میں 3,500 گنا زیادہ حرارت جذب کرتا ہے۔
آپ کو AI کے لیے لیکویڈ کولنگ کی ضرورت کیوں ہے:
- بہتر کارکردگی: یہ تھرمل تھروٹلنگ (thermal throttling) کو روکتا ہے تاکہ GPUs اپنی بھرپور رفتار پر چل سکیں۔
- زیادہ ڈینسٹی: آپ ایک ہی کمرے میں زیادہ کمپیوٹنگ پاور سما سکتے ہیں۔
- کم لاگت: یہ بڑے پنکھوں اور AC یونٹس کے لیے درکار توانائی کو کم کرتا ہے۔
- ہارڈ ویئر کی طویل زندگی: مستحکم درجہ حرارت پرزوں کی خرابی کو روکتا ہے۔
اس کے لیے تین اہم طریقے ہیں:
- Direct-to-chip: حرارت کو براہ راست نکالنے کے لیے GPU پر کولڈ پلیٹس لگائی جاتی ہیں۔
- Rear-door heat exchangers: یہ یونٹس ریک سے نکلتی ہوئی حرارت کو جذب کر لیتے ہیں۔
- Immersion cooling: زیادہ سے زیادہ کولنگ کے لیے سرورز کو ایک خاص غیر موصل مائع (non-conductive fluid) میں رکھا جاتا ہے۔
لیکویڈ کولنگ کی طرف منتقلی کے لیے منصوبہ بندی کی ضرورت ہوتی ہے۔ آپ کو فرش کے وزن، پانی کے نظام اور بجلی کی گنجائش کو چیک کرنا ہوگا۔ اس کی ابتدائی لاگت زیادہ ہے، لیکن آپریشنل بچت اس کے قابل ہے۔
ایئر کولڈ AI کا دور ختم ہو رہا ہے۔ ہائی پرفارمنس انفراسٹرکچر کے لیے اب لیکویڈ کولنگ ایک ضرورت بن چکی ہے۔
اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi