Projekt Rubin od Nvidia wykorzystuje wyższe temperatury, aby osiągnąć niemal zerowe zużycie wody

W miarę jak rewolucja AI przyspiesza, ślad środowiskowy ogromnych centrów danych znajduje się pod intensywną obserwacją. Nvidia stawia czoła temu wyzwaniu dzięki nowemu projektowi referencyjnemu generacji Rubin, który obiecuje zredukować zużycie wody niemal o 100%.

Przejście na chłodzenie cieczą w wysokich temperaturach

Tradycyjne centra danych w dużym stopniu polegają na wieżach chłodniczych, które zużywają ogromne ilości wody do rozpraszania ciepła generowanego przez wysokowydajne chipy. Nowa strategia Nvidii odwraca ten model poprzez przejście na architekturę chłodzoną w 100% cieczą. W przeciwieństwie do systemów chłodzenia powietrzem, które zmagają się z gęstością cieplną nowoczesnych obciążeń AI, projekt Nvidii przechwytuje ciepło bezpośrednio na poziomie chipa.

Dzięki transportowaniu ciepła przez pętle cieczy pracujące w znacznie wyższych temperaturach — do 113 stopni Fahrenheita (45 stopni Celsjusza) — system może wykorzystywać zewnętrzne chłodnice suche do oddawania ciepła. Podejście to pozwala na znacznie większą elastyczność przy zmiennych temperaturach powietrza otoczenia, sprawiając, że proces chłodzenia jest wydajny przez większą część roku, bez konieczności ciągłego odparowywania wody.

Ogromna redukcja zużycia wody

Skala zysków w zakresie wydajności jest oszałamiająca. Według Josha Parkera, szefa ds. zrównoważonego rozwoju w Nvidii, konwencjonalne systemy oparte na wieżach chłodniczych mogą zużywać około 2,6 miliona galonów wody na megawat rocznie. Nvidia twierdzi, że jej projekt referencyjny oparty na Rubin może zredukować tę wartość do poziomu „bliskiego zeru”.

Ta transformacja nie jest tylko teoretyczną optymalizacją; Nvidia zapewnia, że każdy dostawca usług chmurowych i operator centrum danych budujący infrastrukturę dla generacji Rubin już przechodzi na ten standard chłodzenia cieczą. Ta zmiana stanowi krytyczny zwrot w sposobie, w jaki branża zarządza zasobożernymi wymaganiami związanymi z trenowaniem i wdrażaniem wielkoskalowych modeli AI.

Kontekst branżowy i pozostałe wyzwania

Choć przejście na wyższą tolerancję cieplną jest dużym sukcesem w dziedzinie oszczędzania wody, stanowi ono część szerszego trendu branżowego. Amazon niedawno podkreślił podobne wysiłki mające na celu zwiększenie tolerancji cieplnej w swoich obiektach chłodzonych głównie powietrzem, aby zwiększyć wydajność. Jednak skok Nvidii w stronę pełnego chłodzenia cieczą reprezentuje bardziej radykalną zmianę architektury.

Mimo tych postępów, branża AI wciąż stoi przed znaczącymi przeszkodami środowiskowymi. Krytycy zauważają, że choć chłodzenie cieczą rozwiązuje problem zużycia wody podczas eksploatacji, nie uwzględnia ono ogromnych ilości wody i energii wymaganych podczas fazy budowy tych obiektów, ani wpływu na środowisko generacji energii niezbędnej do ich zasilania. Co więcej, wydatki kapitałowe (CAPEX) wymagane do budowy centrów danych chłodzonych cieczą w porównaniu do tradycyjnych centrów chłodzonych powietrzem pozostają kluczowym pytaniem dla operatorów.

Dlaczego ma to znaczenie dla krajobrazu AI

Ponieważ modele LLM i złożone modele AI wymagają coraz gęstszych klastrów obliczeniowych, zarządzanie termiczne sprzętu staje się głównym wąskim gardłem dla skalowania. Zdolność Nvidii do rozwiązania „problemu wody” poprzez inżynierię termiczną zapewnia, że kolejna generacja wzrostu AI może trwać nawet w regionach borykających się z niedoborem wody. Projekt ten ustanawia nowy standard techniczny dla zrównoważonych obliczeń wysokiej wydajności (HPC).

Kluczowe wnioski

  • Niemal zerowe zużycie wody: Projekt referencyjny Rubin od Nvidii ma na celu zredukowanie zużycia wody z 2,6 miliona galonów na megawat rocznie do poziomu bliskiego zeru.
  • Chłodzenie cieczą w wysokich temperaturach: Dzięki pracy serwerów w temperaturach sięgających nawet 113°F (45°C), system wykorzystuje pętle cieczy i chłodnice suche do wydajnego oddawania ciepła.
  • Adopcja w całej branży: Nvidia twierdzi, że wszyscy główni dostawcy usług chmurowych budujący infrastrukturę dla generacji Rubin przechodzą na tę architekturę chłodzoną cieczą.