Giới thiệu về Gen AI dành cho người mới bắt đầu với Python
Hầu hết các lập trình viên viết mã bằng cách sử dụng các quy tắc cố định. Bạn nhận đầu vào, áp dụng các câu lệnh if/else hoặc vòng lặp, và trả về một kết quả có thể dự đoán được. Điều này hoạt động tốt với dữ liệu có cấu trúc như JSON hoặc CSV.
Nhưng còn những tác vụ lộn xộn thì sao?
- Tóm tắt 100 phiếu hỗ trợ (support tickets).
- Chuyển đổi danh sách tính năng thành một email.
- So sánh ưu và nhược điểm từ các bài viết trên blog.
Bạn có thể sử dụng regex hoặc các mẫu (template) phức tạp, nhưng chúng rất không ổn định. Generative AI có thể xử lý những công việc mơ hồ này một cách dễ dàng.
Cách thức hoạt động
Một mô hình tạo sinh tuân theo một vòng lặp đơn giản:
- Nó xem xét prompt của bạn và văn bản trước đó.
- Nó dự đoán mảnh văn bản nhỏ tiếp theo.
- Nó thêm mảnh đó vào văn bản.
- Nó lặp lại quá trình này cho đến khi hoàn thành tác vụ.
Các Mô hình Ngôn ngữ Lớn (LLMs) sử dụng một kiến trúc gọi là transformer. Thay vì đọc từ trái sang phải, mô hình sẽ xem xét tất cả các phần của đầu vào cùng một lúc. Nó quyết định xem những từ nào quan trọng nhất cho dự đoán tiếp theo.
Có hai điều quan trọng đối với các lập trình viên Python: tokens và context windows.
Tokens Các mô hình không đọc các chuỗi (strings) thô. Chúng chia văn bản thành các token. Một token là một mảnh nhỏ của một từ. Giá cả và giới hạn của API sử dụng token thay vì ký tự.
Context Window Đây là lượng văn bản mà mô hình có thể thấy tại một thời điểm. Nó bao gồm prompt của bạn, lịch sử trò chuyện và đầu ra của mô hình. Nếu bạn vượt quá giới hạn này, mô hình sẽ quên các phần cũ nhất của cuộc hội thoại.
Chuyển từ prompt sang agent
Gửi một prompt duy nhất đến mô hình chỉ là bước khởi đầu. Bạn có thể tóm tắt văn bản hoặc giải thích các lỗi. Tuy nhiên, một LLM cơ bản có những hạn chế:
- Nó không thể gọi cơ sở dữ liệu hoặc API của bạn.
- Nó không ghi nhớ các thứ giữa các yêu cầu (requests).
- Nó có thể tự bịa ra các sự thật.
Để xây dựng các sản phẩm thực tế, bạn cần các agent. Một agent bổ sung ba thứ vào LLM:
- Tools (Công cụ): Các hàm như tìm kiếm web hoặc máy tính.
- Memory (Bộ nhớ): Lưu trữ cho các cuộc hội thoại trước đó và dữ liệu người dùng.
- Orchestration (Điều phối): Logic để quyết định sử dụng công cụ nào và khi nào nên dừng lại.
Một LLM thuần túy chỉ đưa ra một câu trả lời. Một agent tiếp nhận một mục tiêu và sử dụng các công cụ cũng như bộ nhớ để đạt được một kết quả đáng tin cậy.
Optional learning community: https://t.me/GyaanSetuAi