Cách các mô hình AI thực sự hoạt động

Bạn sử dụng AI để viết email hoặc sửa mã nguồn. Hầu hết mọi người gọi đó là một thuật toán. Họ không biết nó hoạt động như thế nào. Quy trình này rất dễ hiểu ngay cả khi các phép toán đằng sau nó rất phức tạp.

Ý tưởng cốt lõi là sự dự đoán.

Nếu bạn nhập "The cat sat on the," mô hình sẽ dự đoán từ tiếp theo. Nó chọn "mat" vì từ đó có xác suất cao. Nó lặp lại vòng lặp này từng từ một để xây dựng một câu hoàn chỉnh. Để dự đoán từ tốt, mô hình phải học ngữ pháp, sự thật và logic.

Dưới đây là bốn bước:

  1. Tokens Các mô hình không đọc từ ngữ. Chúng đọc các con số. Chúng chia văn bản thành các mảnh nhỏ gọi là tokens. Mỗi token trở thành một danh sách các con số. Đằng sau mỗi cuộc hội thoại, các phép toán diễn ra ở quy mô khổng lồ.

  2. Training Huấn luyện là cách một mô hình học hỏi. Bạn cho nó xem hàng tỷ trang từ sách và các trang web. Mô hình dự đoán một token và kiểm tra câu trả lời. Nếu sai, hệ thống sẽ điều chỉnh các thiết lập nội bộ của nó. Nó thực hiện việc này hàng nghìn tỷ lần. Không có con người nào viết các quy tắc cho nó cả. Mô hình tự tìm ra các quy luật.

  3. Attention Điều này giúp mô hình hiểu được ngữ cảnh. Trong câu "The trophy did not fit in the suitcase because it was too big," từ "it" ám chỉ chiếc cúp. Cơ chế Attention cho mô hình biết những từ trước đó nào là quan trọng nhất. Điều này cho phép mô hình theo dõi ý nghĩa xuyên suốt các đoạn văn dài.

  4. Fine-tuning Các mô hình thô chỉ là những công cụ dự đoán. Fine-tuning dạy chúng trở thành những trợ lý. Con người sẽ đánh giá các câu trả lời. Mô hình học cách đưa ra các phản hồi hữu ích và an toàn dựa trên các đánh giá này.

Điều gì xảy ra khi bạn nhấn gửi?

Văn bản của bạn được chuyển thành các con số. Những con số đó đi qua các lớp toán học. Mô hình tính toán xác suất cho token tiếp theo. Nó chọn một token và lặp lại quy trình cho đến khi câu trả lời hoàn tất. Việc này diễn ra trong vài giây.

AI không phải là phép thuật. Đó là sự dự đoán ở quy mô khổng lồ. Hiểu được điều này sẽ giúp bạn trở thành một người sử dụng công cụ tốt hơn.

Nguồn: https://dev.to/rameshkumarramu/ai-models-how-do-they-actually-work-2kmm

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi