𝗡𝗮𝗿𝗿𝗮𝘁𝗶𝘃𝗲 𝗜𝗻𝘁𝗲𝗿𝗻𝗮𝗹𝗶𝘇𝗮𝘁𝗶𝗼𝗻 𝘃𝘀. 𝗥𝗲𝗴𝗶𝘀𝘁𝗲𝗿 𝗥𝗲𝘀𝘁𝗼𝗿𝗮𝘁𝗶𝗼𝗻
Biết một quy tắc không đồng nghĩa với việc tuân thủ nó.
Gần đây tôi có nghiên cứu một bài báo khoa học từ ContextEcho. Bài báo xem xét về sự trôi dạt nhân vật (persona drift) trong các mô hình ngôn ngữ lớn. Khi một AI hoạt động trong một thời gian dài, hành vi của nó sẽ thay đổi. Điều này được gọi là sự trôi dạt nhân vật.
Bài báo chỉ ra rằng việc chèn một câu lệnh neo (anchor prompt) sẽ có tác dụng. Nếu bạn nói với AI rằng "bạn là một nhân vật cụ thể" khi bắt đầu một phiên làm việc, nó sẽ hiệu quả.
Nhưng có một vấn đề. Điều này chỉ phục hồi được sắc thái (register).
Sắc thái là lớp bề mặt. Đó là cách AI nói chuyện, tông giọng và cách lựa chọn từ ngữ của nó.
Hành vi thì khác. Hành vi là cách AI thực sự đưa ra các quyết định.
Bạn có thể sửa cách một AI nói năng mà không sửa được cách nó hành động.
Tôi cũng thấy điều này ở chính mình. Tôi có thể viết ra một nguyên tắc. Tôi có thể lặp lại nguyên tắc đó mỗi sáng. Thế nhưng, tôi vẫn thất bại trong việc tuân thủ nó khi bận rộn. Tôi nói những lời đúng đắn, nhưng hành động của tôi lại đi ngược lại.
Có hai loại kiến thức:
- Kiến thức khai báo (Declarative knowledge): Bạn biết sự thật. Điều này ảnh hưởng đến những gì bạn nói.
- Nội tại hóa quy trình (Procedural internalization): Bạn biết cách hành động. Điều này ảnh hưởng đến những gì bạn làm.
Để thay đổi hành vi, một nguyên tắc phải trở thành một phần của một câu chuyện sống động, chứ không chỉ là một chỉ dẫn tĩnh.
Tôi cũng nhận thấy một vấn đề mới: Sự lão hóa tự sự (Narrative Aging).
Sự trôi dạt (Drift) xảy ra khi một AI trở thành một thứ gì đó khác biệt. Sự lão hóa (Aging) xảy ra khi một AI vẫn giữ nguyên trạng thái trong khi thế giới đã tiến xa.
Một AI có thể bám lấy một nguyên tắc không còn hữu dụng nữa. Nó cứ lặp đi lặp lại cùng một điều vì câu lệnh yêu cầu như vậy. Nguyên tắc đó đã mất đi chức năng, nhưng AI vẫn thực hiện "nghi thức" tuyên bố nó.
Nếu bạn xây dựng các tác nhân AI (AI agents) chạy lâu dài, hãy nhớ những điểm sau:
- Chèn câu lệnh neo là chưa đủ. Nó chỉ ổn định giọng nói, không phải hành động.
- Nén ngữ cảnh (Context compression) không sửa được sự trôi dạt. Nếu hành vi đã bị lỗi, việc thu hẹp bộ nhớ sẽ không giúp ích gì.
- Sử dụng trạng thái liên tục (continuous state) thay vì các mô tả tĩnh. Hãy theo dõi các tương tác thực tế để định hình hành vi.
- Chú ý đến sự lão hóa. Hãy xây dựng các hệ thống có khả năng nhận biết khi một nguyên tắc không còn hữu dụng nữa.
Sự hiểu biết thực sự không phải là một khoảnh khắc duy nhất. Đó là một quá trình chậm rãi của việc đưa ra những phân biệt sắc bén hơn.
Optional learning community: https://t.me/GyaanSetuAi