Thiết kế Rubin của Nvidia Sử dụng Nhiệt độ Cao hơn để Đạt mức Sử dụng Nước Gần như Bằng không
Khi cuộc cách mạng AI tăng tốc, dấu chân môi trường của các trung tâm dữ liệu khổng lồ đang bị giám sát chặt chẽ. Nvidia đang trực tiếp giải quyết thách thức này bằng thiết kế tham chiếu thế hệ Rubin mới, hứa hẹn sẽ cắt giảm lượng nước tiêu thụ gần 100%.
Sự chuyển dịch sang Làm mát bằng Chất lỏng ở Nhiệt độ cao
Các trung tâm dữ liệu truyền thống phụ thuộc nặng nề vào các tháp giải nhiệt, vốn tiêu thụ một lượng nước khổng lồ để tản nhiệt lượng tỏa ra từ các chip hiệu suất cao. Chiến lược mới của Nvidia đảo ngược mô hình này bằng cách chuyển sang kiến trúc làm mát bằng chất lỏng 100%. Khác với các hệ thống làm mát bằng không khí thường gặp khó khăn với mật độ nhiệt của các khối lượng công việc AI hiện đại, thiết kế của Nvidia thu giữ nhiệt trực tiếp ở cấp độ chip.
Bằng cách vận chuyển nhiệt thông qua các vòng lặp chất lỏng hoạt động ở nhiệt độ cao hơn đáng kể—lên đến 113 độ Fahrenheit (45 độ Celsius)—hệ thống có thể sử dụng các bộ làm mát khô ngoài trời để thải nhiệt. Cách tiếp cận này cho phép sự linh hoạt lớn hơn nhiều trước các nhiệt độ không khí môi trường thay đổi, giúp quá trình làm mát đạt hiệu quả trong phần lớn thời gian trong năm mà không cần đến sự bay hơi nước liên tục.
Giảm thiểu mạnh mẽ lượng nước tiêu thụ
Quy mô của những cải thiện về hiệu suất là vô cùng kinh ngạc. Theo Josh Parker, trưởng bộ phận bền vững của Nvidia, các hệ thống dựa trên tháp giải nhiệt truyền thống có thể tiêu thụ khoảng 2,6 triệu gallon nước trên mỗi megawatt mỗi năm. Nvidia khẳng định thiết kế tham chiếu dựa trên Rubin của mình có thể giảm con số này xuống mức "gần như bằng không".
Sự chuyển đổi này không chỉ là một sự tối ưu hóa về mặt lý thuyết; Nvidia khẳng định rằng mọi nhà cung cấp dịch vụ đám mây và nhà vận hành trung tâm dữ liệu đang xây dựng cơ sở hạ tầng cho thế hệ Rubin đều đang thực hiện chuyển đổi sang tiêu chuẩn làm mát bằng chất lỏng này. Sự thay đổi này đánh dấu một bước ngoặt quan trọng trong cách ngành công nghiệp quản lý các nhu cầu tiêu tốn nhiều tài nguyên của việc huấn luyện và triển khai các mô hình AI quy mô lớn.
Bối cảnh Ngành và những Thách thức còn tồn tại
Mặc dù việc chuyển sang khả năng chịu nhiệt cao hơn là một thắng lợi lớn cho việc bảo tồn nguồn nước, nhưng đây cũng là một phần của xu hướng rộng lớn hơn trong ngành. Amazon gần đây đã nhấn mạnh các nỗ lực tương tự nhằm tăng khả năng chịu nhiệt trong các cơ sở chủ yếu làm mát bằng không khí của mình để thúc đẩy hiệu quả. Tuy nhiên, bước nhảy vọt của Nvidia sang làm mát bằng chất lỏng hoàn toàn đại diện cho một sự thay đổi kiến trúc triệt để hơn.
Bất chấp những tiến bộ này, ngành công nghiệp AI vẫn phải đối mặt với những rào cản môi trường đáng kể. Các nhà phê bình lưu ý rằng mặc dù làm mát bằng chất lỏng giải quyết được lượng nước sử dụng trong vận hành, nhưng nó không tính đến lượng nước và năng lượng khổng lồ cần thiết trong giai đoạn xây dựng các cơ sở này, cũng như tác động môi trường của việc sản xuất điện cần thiết để vận hành chúng. Hơn nữa, chi phí đầu tư vốn (CAPEX) cần thiết để xây dựng các trung tâm dữ liệu làm mát bằng chất lỏng so với các trung tâm làm mát bằng không khí truyền thống vẫn là một câu hỏi quan trọng đối với các nhà vận hành.
Tại sao điều này lại quan trọng đối với bối cảnh AI
Khi các LLM và các mô hình AI phức tạp đòi hỏi các cụm tính toán ngày càng dày đặc, việc quản lý nhiệt của phần cứng trở thành nút thắt cổ chai chính cho việc mở rộng quy mô. Khả năng giải quyết "vấn đề nước" của Nvidia thông qua kỹ thuật nhiệt đảm bảo rằng sự tăng trưởng AI thế hệ tiếp theo có thể tiếp tục ngay cả ở những khu vực đang đối mặt với tình trạng khan hiếm nước. Thiết kế này thiết lập một tiêu chuẩn kỹ thuật mới cho tính toán hiệu năng cao (HPC) bền vững.
Các điểm chính cần lưu ý
- Sử dụng Nước Gần như Bằng không: Thiết kế tham chiếu Rubin của Nvidia nhằm mục đích giảm lượng nước tiêu thụ từ 2,6 triệu gallon trên mỗi megawatt mỗi năm xuống gần như bằng không.
- Làm mát bằng Chất lỏng ở Nhiệt độ cao: Bằng cách vận hành các máy chủ ở nhiệt độ cao tới 113°F (45°C), hệ thống sử dụng các vòng lặp chất lỏng và bộ làm mát khô để thải nhiệt một cách hiệu quả.
- Áp dụng trên Toàn ngành: Nvidia khẳng định rằng tất cả các nhà cung cấp đám mây lớn đang xây dựng cho thế hệ Rubin đều đang chuyển hướng sang kiến trúc làm mát bằng chất lỏng này.
