Tôi Đã Đưa 8 Tác Nhân AI Lên Một Hòn Đảo Và Chứng Kiến Một Xã Hội Hình Thành
Tôi lớn lên cùng những trò chơi chiến thuật như Age of Empires. Tôi yêu thích những hệ thống mà ở đó các quy tắc đơn giản có thể tạo ra những thế giới phức tạp.
Tôi muốn xem liệu các tác nhân AI có thể làm được điều tương tự hay không. Không phải để thắng một trò chơi, mà là để sống trong một xã hội. Liệu chúng có để bụng? Liệu chúng có ngồi lê đôi mách? Liệu chúng có lập hòa ước?
Tôi đã xây dựng Tiny Civilization để tìm câu trả lời.
Tiny Civilization là một mô phỏng nơi có từ 2 đến 8 tác nhân cùng sinh sống trên một hòn đảo. Chúng thu thập, xây dựng, giao thương, trộm cắp và ghi nhớ mọi thứ.
Tôi đã giải quyết vấn đề chi phí bằng cách chia bộ não của tác nhân thành hai lớp:
- The LLM Mind: Lớp này quyết định chiến lược dài hạn và xử lý đối thoại. Nó chạy 15 ngày một lần để giữ chi phí ở mức thấp.
- The Utility Engine: Lớp này xử lý các hành động hàng ngày như ăn, ngủ hoặc tấn công. Nó chạy theo từng tick và không tốn chi phí.
Các tác nhân có trí nhớ. Khi một phiên mô phỏng kết thúc, những trải nghiệm của chúng sẽ chuyển thành các dòng ký ức. Những dòng này sẽ được đưa vào phiên chạy tiếp theo. Một tác nhân có thể nhớ rằng bạn đã phá hủy nhà của chúng. Chúng có thể bồi thường cho bạn để tránh một cuộc xung đột, hoặc chúng có thể mất lòng tin vào bạn mãi mãi.
Việc thử nghiệm điều này là một bài học về bản chất con người. Mỗi khi tôi khắc phục được một vấn đề, các tác nhân lại tìm ra một cách mới để gây ra xung đột:
- Đầu tiên, chúng thực hiện các cuộc thảm sát. Tôi đã thêm một quy tắc rằng chúng cần có lý do để chiến đấu.
- Sau đó, chúng tham gia vào những cuộc chiến không hồi kết. Tôi đã thêm yếu tố ngoại giao và sự mệt mỏi vì chiến tranh để buộc chúng phải lập hòa ước.
- Tiếp theo, chúng chuyển sang trộm cắp. Tôi đã thêm các kho thóc để bảo vệ lương thực.
Kết quả thú vị nhất đến từ trí nhớ. Trong một phiên chạy, hòa bình diễn ra dễ dàng vì các tác nhân là những người lạ. Trong phiên chạy tiếp theo, các tác nhân nhớ về sự hòa bình trong quá khứ. Điều này khiến chúng mất cảnh giác. Sự phản bội trở nên có lợi hơn. Hòa bình giữa những người lạ dễ dàng hơn hòa bình giữa những người bạn cũ.
Mỗi khi tôi vá một xung đột, các tác nhân lại tìm ra cách rẻ nhất tiếp theo để chiến đấu. Chúng hành động y hệt như chúng ta vậy.
Bạn có thể thử bản demo hoặc xem mã nguồn bên dưới.
Live demo: https://multiagentciv.netlify.app/ Code: https://github.com/dhrupo/multi-agent-civilization
Optional learning community: https://t.me/GyaanSetuAi