OpenAI và Broadcom công bố Jalapeño: Chip tùy chỉnh dành cho suy luận LLM
OpenAI đang chính thức tiến xa hơn phần mềm bằng cách lấn sân sang lĩnh vực silicon tùy chỉnh với việc công bố "Jalapeño", một Bộ xử lý Trí tuệ (Intelligence Processor) chuyên dụng. Được phát triển thông qua quan hệ đối tác với Broadcom, bộ tăng tốc tùy chỉnh này được thiết kế để tối ưu hóa việc suy luận mô hình ngôn ngữ lớn (LLM) ở quy mô khổng lồ.
Kiến trúc được xây dựng chuyên biệt cho các LLM hiện đại
Không giống như nhiều giải pháp hiện nay dựa trên các GPU đa năng được sửa đổi, Jalapeño là một thiết kế được xây dựng từ đầu, được kỹ thuật hóa đặc biệt cho các yêu cầu độc nhất của việc suy luận LLM. Mục tiêu là giải quyết các nút thắt cổ chai chính của AI hiện đại: di chuyển dữ liệu và việc sử dụng phần cứng chưa hiệu quả. Bằng cách tối ưu hóa kiến trúc để đẩy mức độ sử dụng tiến gần hơn đến mức tối đa lý thuyết, OpenAI đặt mục tiêu cải thiện đáng kể hiệu suất trên mỗi watt so với các phần cứng tiên tiến nhất hiện nay.
Mặc dù OpenAI vẫn chưa công bố báo cáo kỹ thuật chính thức hay các kết quả đo kiểm (benchmark) độc lập, nhưng các thử nghiệm nội bộ ban đầu cho thấy mức tăng hiệu quả đáng kể. Các mẫu kỹ thuật đang được sử dụng trong môi trường phòng thí nghiệm để chạy các khối lượng công việc học máy phức tạp, bao gồm cả mô hình GPT-5.3-Codex-Spark—một mô hình hiện đang dựa vào phần cứng Cerebras cho các nhu cầu suy luận của mình.
Sự hợp tác giữa các "ông lớn" đa công ty
Việc phát triển Jalapeño là một nỗ lực đa đối tác tinh vi, trải dài trên toàn bộ ngăn xếp phần cứng (hardware stack). OpenAI dẫn đầu việc thiết kế chip, tận dụng các mô hình AI của chính mình để đẩy nhanh chu kỳ phát triển, được cho là chỉ mất chín tháng từ khâu thiết kế đến khi hoàn tất sản xuất (tape-out). Broadcom cung cấp chuyên môn sản xuất silicon quan trọng và công nghệ mạng tiên tiến, bao gồm các chip mạng Tomahawk hiệu suất cao. Để hoàn thiện hệ sinh thái, Celestica chịu trách nhiệm về các bo mạch, tủ rack và tích hợp toàn bộ hệ thống.
Sự hợp tác này đại diện cho một bước chuyển chiến lược của OpenAI, chuyển từ một công ty chỉ tập trung vào các mô hình và sản phẩm sang một công ty kiểm soát ngăn xếp phần cứng nền tảng. Bằng cách sở hữu silicon, về lý thuyết, OpenAI có thể chạy các mô hình của mình nhanh hơn, đáng tin cậy hơn và với chi phí thấp hơn nhiều so với các đối thủ cạnh tranh đang phụ thuộc vào các nhà cung cấp bên thứ ba.
Mở rộng quy mô lên mức Gigawatt vào năm 2026
Lộ trình cho Jalapeño rất đầy tham vọng. CEO của Broadcom, Hock Tan, đã cho biết đợt triển khai đầu tiên dự kiến vào cuối năm 2026, với ý định vận hành ở quy mô gigawatt cùng với Microsoft và các đối tác chiến lược khác. Quy mô của đợt triển khai này nhấn mạnh các yêu cầu cơ sở hạ tầng khổng lồ của AI thế hệ tiếp theo.
Các báo cáo cho thấy mối quan hệ đối tác này bao gồm các cam kết thương mại đáng kể, trong đó Microsoft được cho là sẽ đảm bảo mua 40% sản lượng chip ban đầu để đảm bảo giai đoạn đầu tiên. Mức độ tích hợp theo chiều dọc và nhu cầu được đảm bảo này báo hiệu một bước đi lớn hướng tới việc ổn định chuỗi cung ứng chi phí cao, năng lượng cao cần thiết để duy trì cuộc cách mạng AI.
Các điểm chính cần lưu ý
- Chiến lược Silicon tùy chỉnh: Jalapeño là một "Bộ xử lý Trí tuệ" được thiết kế từ đầu để suy luận LLM, nhằm mục tiêu vượt qua phần cứng đa năng về hiệu suất trên mỗi watt.
- Phát triển nhanh chóng: Bằng cách sử dụng các mô hình AI của chính mình để đẩy nhanh quá trình, OpenAI đã đạt được chu kỳ từ thiết kế đến tape-out trong chín tháng, một kỷ lục đối với các chip ASIC hiệu suất cao.
- Triển khai quy mô lớn: Đợt triển khai quy mô lớn đầu tiên được đặt mục tiêu vào cuối năm 2026 ở quy mô gigawatt, với sự hỗ trợ từ Broadcom và Microsoft.
