Cách OpenAI và Anthropic thiết kế các hệ thống AI

Nhiều người cố gắng tìm hiểu ngược (reverse-engineer) các công ty AI bằng cách xem tài liệu API hoặc các bài viết trên blog. Họ chỉ tập trung vào các mô hình (models) và các điểm cuối (endpoints). Điều này dẫn đến những kết luận sai lầm.

Mô hình chỉ là một phần của bài toán.

Các công ty như OpenAI và Anthropic không chỉ xây dựng các mô hình. Họ xây dựng những hệ sinh thái khổng lồ. Họ xây dựng các hệ thống phân tán quy mô lớn.

Nếu bạn nghĩ rằng họ chỉ có các mô hình tốt hơn, bạn đã bỏ lỡ bí mật thực sự. Thành công của họ đến từ cách họ huấn luyện, triển khai và cải thiện các mô hình đó thông qua các vòng lặp tích hợp.

Một hệ thống AI trong môi trường production ở quy mô này đòi hỏi nhiều lớp khác nhau:

• Data Pipelines: Để thu thập và làm sạch dữ liệu huấn luyện. • Training Infrastructure: Để quản lý chi phí tính toán khổng lồ và tính song song. • Model Layer: Kiến trúc cốt lõi để đảm bảo độ chính xác. • Inference Layer: Để cung cấp phản hồi với độ trễ thấp. • Safety Layer: Để thực thi các rào chắn (guardrails) và sự căn chỉnh (alignment). • Observability: Để giám sát hiệu suất và gỡ lỗi (debug) các lỗi. • Feedback Loops: Để cải thiện mô hình theo thời gian.

Mỗi lớp đều phụ thuộc vào các lớp khác. Nếu bạn thay đổi một lớp, bạn sẽ tác động đến toàn bộ hệ thống.

Huấn luyện cũng là một quá trình liên tục. Các công ty này không huấn luyện một mô hình rồi dừng lại. Họ sử dụng mô hình huấn luyện liên tục (continuous training paradigm). Họ sử dụng hàng nghìn GPU để xử lý các luồng dữ liệu mới liên tục.

Sự căn chỉnh (alignment) và an toàn cũng là cốt lõi trong thiết kế của họ. Họ sử dụng các chiến lược khác nhau để định hướng hành vi của mô hình:

• RLHF: Sử dụng phản hồi từ con người để căn chỉnh chất lượng cao. • Constitutional AI: Sử dụng hướng dẫn dựa trên quy tắc để mở rộng quy mô. • Prompt Constraints: Sử dụng các chỉ dẫn hệ thống để thiết lập nhanh chóng. • Output Filtering: Sử dụng hậu xử lý để kiểm duyệt.

Họ kết hợp các phương pháp này để duy trì sự mạnh mẽ.

Khi mô hình đã sẵn sàng, họ phải triển khai phục vụ (serve) nó. Họ sử dụng các kỹ thuật như batching, caching và quantization. Những kỹ thuật này giúp quản lý sự đánh đổi giữa tốc độ và chi phí.

Cuối cùng, họ sử dụng observability để quan sát mọi thứ. Vì đầu ra của AI không phải lúc nào cũng giống nhau, việc gỡ lỗi rất khó khăn. Bạn không thể chỉ nhìn vào một lỗi duy nhất. Bạn phải nhìn vào các mô hình (patterns) trên toàn bộ hệ thống.

Thành công trong AI đến từ việc quản lý các tương tác phức tạp này. Họ coi AI là một hệ thống đang tiến hóa, chứ không phải là một sản phẩm tĩnh.

Source: https://dev.to/stack_overflowed/how-companies-like-openai-and-anthropic-design-their-ai-systems-2537

Optional learning community: https://t.me/GyaanSetuAi