Unconventional AI đặt mục tiêu cắt giảm 1.000 lần mức tiêu thụ điện năng của AI

Khi nhu cầu toàn cầu về trí tuệ nhân tạo đang đe dọa vượt quá nguồn cung năng lượng hiện có, một startup mới đang nỗ lực viết lại các quy tắc về kiến trúc phần cứng. Được dẫn dắt bởi cựu giám đốc AI của Databricks, Naveen Rao, Unconventional AI đang đặt cược vào một phương pháp tính toán mới mang tính đột phá để giải quyết cuộc khủng hoảng năng lượng đang cận kề của ngành công nghiệp này.

Vượt xa các kiến trúc silicon truyền thống

Cốt lõi trong sứ mệnh của Unconventional AI nằm ở việc thoát ly khỏi các loại chip truyền thống vốn đang vận hành các Mô hình Ngôn ngữ Lớn (LLM) và các mô hình khuếch tán (diffusion models). Trong khi ngành công nghiệp phần lớn tập trung vào việc tối ưu hóa các kiến trúc GPU và TPU hiện có, Rao và đội ngũ của ông đang xây dựng mọi thứ từ con số không bằng cách sử dụng kiến trúc máy tính dựa trên bộ dao động (oscillator-based computer architecture).

Cách tiếp cận này khác biệt về mặt bản chất so với các bóng bán dẫn (transistor) được sử dụng trong tính toán kỹ thuật số tiêu chuẩn. Bằng cách tận dụng các bộ dao động, công ty đặt mục tiêu thực hiện quá trình xử lý suy luận (inference processing) với hiệu suất chưa từng có. Rao cho rằng sự chuyển dịch này cuối cùng có thể giảm mức tiêu thụ điện năng cần thiết cho việc suy luận AI lên tới 1.000 lần, biến AI từ một gánh nặng tiêu tốn năng lượng thành một tiện ích bền vững.

Un0: "Hello World" của kỷ nguyên tính toán dựa trên bộ dao động

Để chứng minh tính khả thi của khái niệm phần cứng đột phá này, công ty gần đây đã công bố mô hình đầu tiên của mình, Un0. Mặc dù Un0 hiện đang chạy trên một bản mô phỏng phần mềm của các chip dao động mà công ty dự định chế tạo, nhưng các kết quả đạt được là rất đáng kể. Mô hình này là một hệ thống tạo hình ảnh có khả năng tái hiện hiệu suất của các mô hình khuếch tán tiên tiến nhất như Stable Diffusion hoặc GPT Image 1 của OpenAI.

Mô tả bản phát hành này như là "hello world" của một loại máy tính mới, Rao nhấn mạnh rằng mục tiêu là để chứng minh rằng một logic phần cứng hoàn toàn khác biệt vẫn có thể tạo ra các đầu ra chất lượng cao và có độ trung thực cao. Bài báo nghiên cứu đi kèm chi tiết hóa cách kiến trúc mô phỏng này có thể xử lý thành công các tác vụ tạo nội dung (generative tasks) phức tạp, cung cấp một lộ trình cho phần cứng vật lý thực hiện theo.

Giải quyết nút thắt năng lượng trong việc mở rộng quy mô AI

Thời điểm của sự phát triển này là vô cùng quan trọng. Khi các mô hình AI mở rộng về số lượng tham số và độ phức tạp, rào cản chính đối với sự tăng trưởng đang chuyển dịch từ sự sẵn có của dữ liệu sang sự sẵn có của năng lượng. Rao lập luận rằng năng lượng sẽ trở thành "giới hạn cơ bản" cho AI trong những năm tới, tạo ra một mức trần cứng cho lượng trí tuệ có thể được triển khai.

Unconventional AI có kế hoạch giải quyết vấn đề này bằng cách xây dựng một ngăn xếp suy luận (inference stack) hoàn chỉnh. Lộ trình bao gồm:

  • Phát triển các chip vật lý dựa trên bộ dao động và công bố sơ đồ thiết kế (schematics) của chúng.
  • Xây dựng toàn bộ hệ thống bao gồm các chip độc quyền này.
  • Cung cấp năng lực tính toán dưới dạng dịch vụ, nơi người dùng gửi các câu lệnh (prompts) qua cáp mạng và nhận kết quả suy luận với chi phí năng lượng chỉ bằng 1/1000 so với hiện tại.

Mặc dù công ty vẫn duy trì quy mô tinh gọn với ít hơn 50 nhân viên, nhưng sứ mệnh của họ đang giải quyết rào cản kinh tế vĩ mô lớn nhất mà toàn bộ lĩnh vực AI đang phải đối mặt: chi phí điện năng không bền vững.

Các điểm chính cần lưu ý

  • Sự chuyển dịch phần cứng đột phá: Unconventional AI đang chuyển hướng từ silicon truyền thống sang kiến trúc dựa trên bộ dao động để tối ưu hóa việc suy luận AI.
  • Hiệu suất đã được chứng minh: Mô hình Un0 của công ty chứng minh rằng kiến trúc mới này có thể sánh ngang với khả năng tạo hình ảnh của các đơn vị dẫn đầu ngành như Stable Diffusion.
  • Giải quyết cuộc khủng hoảng năng lượng: Mục tiêu cuối cùng là giảm mức tiêu thụ điện năng của AI xuống 1.000 lần, giải quyết nút thắt năng lượng đang cận kề vốn đe dọa giới hạn khả năng mở rộng của AI.