What Is Loopcraft?
Thế giới AI đang có một thuật ngữ mới: Loopcraft.
Một số người có thể coi đây là một cái tên mới cho một khái niệm cũ. Trước đây, người ta thường gọi là Agent Loops hoặc Workflow Engineering. Nhưng sự chuyển dịch đang diễn ra tại Thung lũng Silicon là có thật.
Các chuyên gia như Andrej Karpathy và Boris Cherny đang dần rời xa việc viết prompt thủ công. Họ không còn trực tiếp ra lệnh cho các tác nhân (agents) nữa. Thay vào đó, họ đang thiết kế các vòng lặp (loops) để điều khiển các tác nhân đó.
Sự chuyển dịch cốt lõi nằm ở tính trừu tượng.
Cách cũ: Con người -> Prompt -> Tác nhân -> Kết quả
Cách mới: Con người -> Thiết kế vòng lặp -> Khám phá nhiệm vụ -> Thực thi -> Xác minh tự động -> Thử lại -> Lưu trạng thái -> Tiếp tục
Prompt Engineering tối ưu hóa một lần tương tác. Loopcraft tối ưu hóa toàn bộ hệ thống vận hành lặp đi lặp lại.
Loopcraft tập trung vào các câu hỏi mang tính hệ thống:
- Ai sẽ bắt đầu nhiệm vụ tiếp theo?
- Làm thế nào để tác nhân biết được mục tiêu?
- Ai là người kiểm tra kết quả đầu ra?
- Làm thế nào để thất bại tạo ra phản hồi?
- Trạng thái được lưu trữ như thế nào qua các phiên làm việc?
Nếu bạn chỉ tự động hóa một bước, bạn không phải đang xây dựng một hệ thống. Bạn chỉ đang tăng tốc một quy trình thủ công.
Một vòng lặp thực thụ sẽ xử lý toàn bộ vòng đời. Ví dụ, thay vì bạn phải tự tay sửa lỗi CI, một hệ thống Loopcraft sẽ:
- Phát hiện lỗi.
- Đọc nhật ký (logs).
- Khởi chạy một tác nhân trong một môi trường cô lập.
- Chỉnh sửa mã nguồn.
- Chạy thử nghiệm (tests).
- Sử dụng một bộ xác minh thứ hai để kiểm tra sự khác biệt (diff).
- Tạo một PR sau khi vượt qua các bài kiểm tra.
Đây chính là sự khác biệt giữa một Agent Harness và Loopcraft. Harness là môi trường. Nó cung cấp các công cụ, bộ nhớ và quyền hạn. Nó trả lời câu hỏi: "Tác nhân hoạt động như thế nào?" Loopcraft là sự điều phối (orchestration). Nó trả lời câu hỏi: "Khi nào tác nhân chạy, và tại sao nó tiếp tục?"
Để xây dựng một vòng lặp tối thiểu, bạn cần sáu thành phần:
- Trigger: Một sự kiện như lỗi CI hoặc một công việc được lên lịch.
- Goal: Một điều kiện hoặc bài kiểm tra có thể xác minh bằng máy.
- State: Cách để lưu trữ tiến độ và lý do thất bại.
- Worker: Tác nhân chạy trong một container cô lập.
- Verifier: Một bài kiểm tra hoặc một LLM thứ hai để đánh giá công việc.
- Budget: Giới hạn về thời gian, chi phí và số lần thử lại.
Cấp độ cao nhất của Loopcraft là vòng lặp cải tiến (improvement loop). Một vòng lặp đơn giản chỉ lặp lại công việc. Một vòng lặp cải tiến sẽ phân tích các thất bại để thay đổi chính hệ thống đó. Nó điều chỉnh các prompt và công cụ để lần chạy tiếp theo đạt kết quả tốt hơn.
Đừng cố gắng sửa từng kết quả một cách thủ công nữa. Hãy bắt đầu sửa chữa hệ thống tạo ra những kết quả đó.
Source: https://dev.to/luhuidev/what-is-loopcraft-from-prompt-engineering-to-agent-loop-system-design-2dff
Optional learning community: https://t.me/GyaanSetuAi
