𝗟𝗟𝗠𝘀 𝘃𝘀 𝗔𝗜 𝗧ạ𝗼 𝘀𝗶𝗻𝗵

AI Tạo sinh là một thuật ngữ rộng. LLM là một loại mô hình cụ thể trong nhóm đó. Bạn cần hiểu các khác biệt về mặt kỹ thuật để xây dựng các hệ thống tốt hơn.

LLM sử dụng Transformer để dự đoán token tiếp theo. Chúng hoạt động thông qua các quy trình tự hồi quy (autoregressive).

Cách một LLM hoạt động:

  • Mô hình nhận một câu lệnh (prompt).
  • Nó chuyển đổi văn bản thành các token.
  • Nó tính toán xác suất của token tiếp theo.
  • Nó lặp lại vòng lặp này để tạo thành các câu.

Các mô hình Diffusion hoạt động theo cách khác. Chúng tạo ra hình ảnh bằng cách đảo ngược quá trình nhiễu.

Cách một mô hình Diffusion hoạt động:

  • Hệ thống bắt đầu với nhiễu ngẫu nhiên.
  • Nó loại bỏ nhiễu từng bước một.
  • Nó tuân theo một khuôn mẫu để hiển thị hình ảnh.
  • Nó sử dụng các câu lệnh (prompt) để hướng dẫn quá trình khử nhiễu (denoising).

So sánh nhanh: • LLM: Sử dụng Transformer tự hồi quy. Đầu ra là các token văn bản. • Diffusion: Sử dụng khử nhiễu lặp (iterative denoising). Đầu ra là các điểm ảnh (pixels). • GAN: Sử dụng huấn luyện đối nghịch (adversarial training). Đầu ra là dữ liệu tổng hợp.

Ranh giới giữa các mô hình này đang thay đổi. Hầu hết các hệ thống hiện đại hiện nay đều sử dụng kiến trúc nền tảng (backbone) là Transformer. Kiến trúc đang trở nên mang tính kết hợp (compositional). Điều này có nghĩa là các loại mô hình khác nhau sẽ hoạt động cùng nhau trong một hệ thống duy nhất.

Nguồn: https://dev.to/aljen_007/llms-vs-generative-ai-7gc