Bước đột phá về bóng bán dẫn của IBM và cuộc chạy đua vũ trang phần cứng AI toàn cầu
Từ những đổi mới bán dẫn mang tính đột phá đến các cuộc chiến sở hữu trí tuệ đầy căng thẳng, bối cảnh công nghệ đang thay đổi nhanh chóng. Khi IBM nỗ lực kéo dài Định luật Moore thông qua mật độ chip chưa từng có, ngành công nghiệp AI đồng thời đang phải đối mặt với các "cuộc tấn công chưng cất" (distillation attacks) và sự gia tăng mạnh mẽ về nhu cầu phần cứng.
IBM nhắm tới Định luật Moore với nguyên mẫu 100 tỷ bóng bán dẫn
Trong nhiều thập kỷ, ngành bán dẫn đã dựa vào việc thu nhỏ các bóng bán dẫn để tăng hiệu suất, một quá trình đang nhanh chóng tiến tới các giới hạn vật lý. IBM đã công bố một nguyên mẫu chip mới nhằm vượt qua những giới hạn này bằng cách chuyển từ thu nhỏ theo chiều ngang sang mở rộng theo chiều dọc—một phương pháp tương tự như việc phát triển các tòa nhà cao tầng ở đô thị.
Nguyên mẫu mới này sở hữu khoảng 100 tỷ bóng bán dẫn được nén trong một diện tích không lớn hơn một chiếc móng tay. Điều này đại diện cho một bước nhảy vọt về mật độ, giúp tăng gấp đôi hiệu quả dung lượng so với công nghệ tiên tiến nhất trước đó của IBM được công bố vào năm 2021. Bằng cách "xây dựng lên cao" thay vì chỉ "thu nhỏ lại", thiết kế của IBM có thể kéo dài quỹ đạo của Định luật Moore thêm một thập kỷ nữa, hứa hẹn khả năng tính toán nhanh hơn và tiết kiệm năng lượng hơn đáng kể cho thế hệ AI và xử lý dữ liệu tiếp theo.
Anthropic cáo buộc Alibaba thực hiện "chưng cất" mô hình bất hợp pháp
Bối cảnh cạnh tranh của các Mô hình Ngôn ngữ Lớn (LLM) đã trở nên đầy rẫy các vụ kiện tụng. Anthropic đã đưa ra những cáo buộc nghiêm trọng chống lại công ty Alibaba của Trung Quốc, khẳng định rằng công ty này đã dàn dựng một chiến dịch "trắng trợn" nhằm trích xuất các khả năng từ các mô hình Claude của họ.
Anthropic mô tả đây là "cuộc tấn công chưng cất lớn nhất từng được biết đến" trong ngành. Trong một cuộc tấn công chưng cất, một nhà phát triển sử dụng đầu ra của một mô hình tinh vi và "mạnh hơn" để huấn luyện một mô hình "yếu hơn". Điều này cho phép công ty thứ hai sao chép khả năng lập luận và hiệu suất của mô hình gốc mà không cần tốn kém chi phí R&D khổng lồ thường thấy khi huấn luyện các hệ thống như vậy từ đầu. Sự việc này làm nổi bật căng thẳng ngày càng tăng trong lĩnh vực AI liên quan đến bảo mật mô hình và bảo vệ sở hữu trí tuệ trong một thị trường toàn cầu hóa.
Áp lực lên cơ sở hạ tầng: Năng lượng, Chip và Lạm phát
Khi khả năng của AI mở rộng, cơ sở hạ tầng vật lý cần thiết để hỗ trợ chúng đang phải đối mặt với áp lực chưa từng có. "Sự bùng nổ trung tâm dữ liệu" hiện đang thúc đẩy làn sóng lạm phát thứ ba, với nhu cầu chip nhớ tăng vọt đẩy giá cả lên cao trong toàn bộ chuỗi cung ứng.
Đồng thời, các yêu cầu về năng lượng của những cụm máy tính khổng lồ này đang va chạm với thực tế khí hậu. Tại Châu Âu, các đợt nắng nóng kỷ lục đang đẩy lưới điện đến giới hạn. Trong khi nhu cầu điện tăng vọt do nhu cầu làm mát, nhiệt độ cao cũng đang ảnh hưởng đến khả năng hoạt động của các nhà máy điện, tạo ra một sự cân bằng mong manh giữa nhu cầu tính toán ngày càng tăng và sự ổn định của lưới điện.
Các điểm chính cần lưu ý
- Đổi mới bán dẫn: Nguyên mẫu chip mới của IBM giúp tăng gấp đôi mật độ bóng bán dẫn bằng cách sử dụng phương pháp mở rộng theo chiều dọc, có khả năng kéo dài Định luật Moore thêm mười năm.
- Rủi ro bảo mật AI: Anthropic đã cảnh báo về một "cuộc tấn công chưng cất" quy mô lớn từ Alibaba, báo hiệu một ranh giới mới trong việc đánh cắp trí tuệ của các mô hình AI.
- Áp lực phần cứng & năng lượng: Sự mở rộng nhanh chóng của cơ sở hạ tầng AI đang đẩy giá chip lên cao và gây áp lực nặng nề lên lưới điện toàn cầu.
