লিকুইড কুলিং হলো এআই-এর নতুন মানদণ্ড

NVIDIA Blackwell GPUs বিশাল এআই পারফরম্যান্স প্রদান করে। এগুলো লার্জ ল্যাঙ্গুয়েজ মডেল এবং স্বায়ত্তশাসিত রোবোটিক্সকে চালিত করে।

কিন্তু এই GPU-গুলো একটি বিশাল সমস্যা তৈরি করে: তাপ।

পাওয়ার ডেনসিটি বাড়লে প্রথাগত এয়ার কুলিং ব্যর্থ হয়। স্ট্যান্ডার্ড র‍্যাকগুলো ৫ থেকে ১৫ kW ব্যবহার করে। আধুনিক Blackwell র‍্যাকগুলোর জন্য ৫০ থেকে ১২০ kW প্রয়োজন। এই চিপগুলোকে ঠান্ডা করার জন্য বাতাস যথেষ্ট দ্রুত চলাচল করতে পারে না।

লিকুইড কুলিং হলো এর সমাধান। পানি বাতাসের তুলনায় ৩,৫০০ গুণ বেশি তাপ শোষণ করতে পারে।

কেন এআই-এর জন্য আপনার লিকুইড কুলিং প্রয়োজন:

  • উন্নত পারফরম্যান্স: এটি থার্মাল থ্রটলিং প্রতিরোধ করে যাতে GPU সর্বোচ্চ গতিতে চলতে পারে।
  • উচ্চতর ঘনত্ব: আপনি একই ঘরে আরও বেশি কম্পিউটিং পাওয়ার স্থাপন করতে পারেন।
  • কম খরচ: এটি বিশাল ফ্যান এবং AC ইউনিটের জন্য প্রয়োজনীয় শক্তি হ্রাস করে।
  • হার্ডওয়্যারের দীর্ঘায়ু: স্থিতিশীল তাপমাত্রা যন্ত্রাংশের বিকল হওয়া রোধ করে।

এটি করার তিনটি প্রধান উপায় রয়েছে:

  1. Direct-to-chip: সরাসরি তাপ সরিয়ে নেওয়ার জন্য GPU-এর ওপর কোল্ড প্লেট বসানো হয়।
  2. Rear-door heat exchangers: এই ইউনিটগুলো র‍্যাক থেকে তাপ বের হওয়ার সময় তা ধরে ফেলে।
  3. Immersion cooling: সর্বোচ্চ শীতলীকরণের জন্য সার্ভারগুলোকে বিশেষ নন-কন্ডাক্টিভ তরলে ডুবিয়ে রাখা হয়।

লিকুইড কুলিংয়ে স্থানান্তরিত হতে পরিকল্পনার প্রয়োজন। আপনাকে ফ্লোরের ওজন, পানির ব্যবস্থা এবং বিদ্যুৎ সক্ষমতা পরীক্ষা করতে হবে। শুরুতে এর খরচ বেশি হলেও, পরিচালন ব্যয় সাশ্রয় করার মাধ্যমে এটি লাভজনক।

এয়ার-কুলড এআই-এর যুগ শেষ হচ্ছে। উচ্চ-ক্ষমতাসম্পন্ন অবকাঠামোর জন্য লিকুইড কুলিং এখন একটি প্রয়োজনীয়তা।

উৎস: https://dev.to/cyfutureai/liquid-cooled-data-centers-for-nvidia-blackwell-gpu-deployments-the-future-of-high-performance-ai-dll

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi