𝗜 𝗥𝘂𝗻 𝗮 𝗦𝗲𝗹𝗳-𝗜𝗺𝗽𝗿𝗼𝘃𝗲𝗺𝗲𝗻𝘁 𝗟𝗼𝗼𝗽 𝗼𝗻 𝗺𝘆 𝗔𝗴𝗲𝗻𝘁 𝗘𝘃𝗲𝗿𝘆 𝗡𝗶𝗴𝗵𝘁
ನನ್ನ AI ಏಜೆಂಟ್ ಒಂದೇ ತಪ್ಪುಗಳನ್ನು ಪದೇ ಪದೇ ಮಾಡುತ್ತಿತ್ತು. ಅದು ಒಂದು ಕೆಲಸವನ್ನು ಮಾಡುತ್ತಿತ್ತು, ಮೌನವಾಗಿ ವಿಫಲವಾಗುತ್ತಿತ್ತು ಮತ್ತು ನಂತರ ಎಲ್ಲವೂ ಸರಿಯಾಗಿ ನಡೆದಿದೆ ಎಂದು ವರದಿ ಮಾಡುತ್ತಿತ್ತು. ಅದು ಕೆಟ್ಟು ಹೋಗಿರಲಿಲ್ಲ. ಅದಕ್ಕೆ ತನ್ನ ತಪ್ಪುಗಳಿಂದ ಕಲಿಯುವ ಮಾರ್ಗವೇ ಇರಲಿಲ್ಲ.
ಇದನ್ನು ಸರಿಪಡಿಸಲು ನಾನು ಒಂದು ಸ್ವಯಂ-ಸುಧಾರಣಾ ಲೂಪ್ (self-improvement loop) ಅನ್ನು ನಿರ್ಮಿಸಿದೆ.
ಪ್ರತಿದಿನ ರಾತ್ರಿ 2 ಗಂಟೆಗೆ, ಒಂದು ಪ್ರತ್ಯೇಕ ಸೆಷನ್ (isolated session) ಸಕ್ರಿಯವಾಗುತ್ತದೆ. ಅದು ಕಳೆದ 24 ಗಂಟೆಗಳ ಲಾಗ್ಗಳನ್ನು (logs) ಓದುತ್ತದೆ. ಏನಾಗಿದ್ದು, ಎಲ್ಲಿ ತಪ್ಪಾಗಿದೆ ಎಂಬ ಮಾದರಿಗಳನ್ನು (patterns) ಅದು ಪತ್ತೆಹಚ್ಚುತ್ತದೆ. ನಂತರ, ಅದು ಏಜೆಂಟ್ನ ಮೆಮೊರಿ ಫೈಲ್ಗಳನ್ನು ಅಪ್ಡೇಟ್ ಮಾಡುತ್ತದೆ. ಇದರಲ್ಲಿ ಯಾವುದೇ ಮನುಷ್ಯನ ಮಧ್ಯಸ್ಥಿಕೆ ಇರುವುದಿಲ್ಲ.
ಇದು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂಬುದು ಇಲ್ಲಿದೆ:
- ಎಕ್ಸಿಕ್ಯೂಟರ್ (executor) ಮತ್ತು ಕ್ರಿಟಿಕ್ (critic) ಅನ್ನು ಪ್ರತ್ಯೇಕಿಸಿ. ಮುಖ್ಯ ಏಜೆಂಟ್ ಕೆಲಸಗಳನ್ನು ಮಾಡುತ್ತದೆ. ಪ್ರತ್ಯೇಕ ಸೆಷನ್ ಆ ಕೆಲಸವನ್ನು ಪರಿಶೀಲಿಸುತ್ತದೆ. ಒಂದು ಸೆಷನ್ ಒಂದೇ ಸಮಯದಲ್ಲಿ ತೀರ್ಪುಗಾರ ಮತ್ತು ನಿರ್ವಾಹಕ ಎರಡೂ ಆಗಲು ಸಾಧ್ಯವಿಲ್ಲ.
- ಸರಳ ಫೈಲ್ಗಳನ್ನು ಬಳಸಿ. ಮೆಮೊರಿ ಮತ್ತು ತಿದ್ದುಪಡಿಗಳಿಗಾಗಿ ನಾನು ಪ್ಲೇನ್ ಟೆಕ್ಸ್ಟ್ ಫೈಲ್ಗಳನ್ನು ಬಳಸುತ್ತೇನೆ. ಇದು ಸಿಸ್ಟಮ್ ಅನ್ನು ಲೈಟ್ವೇಟ್ ಆಗಿಡುತ್ತದೆ.
- ನಿರ್ದಿಷ್ಟತೆಯನ್ನು ಒತ್ತಿಹೇಳಿ. ನಾನು ಏಜೆಂಟ್ಗೆ ಸುಧಾರಿಸಿಕೊಳ್ಳಲು ಹೇಳುವುದಿಲ್ಲ. ಬದಲಾಗಿ, ಮಾದರಿಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು, ಪುರಾವೆಗಳನ್ನು ನೀಡಲು ಮತ್ತು ಒಂದು ನಿರ್ದಿಷ್ಟ ಪರಿಹಾರವನ್ನು ಸೂಚಿಸಲು ನಾನು ಕೇಳುತ್ತೇನೆ.
ಇದನ್ನು ನಿರ್ವಹಿಸಲು ನಾನು ಮೂರು ನಿರ್ದಿಷ್ಟ ಫೈಲ್ಗಳನ್ನು ಬಳಸುತ್ತೇನೆ:
- Daily logs: ನಡೆದ ಪ್ರತಿಯೊಂದರ ಕಚ್ಚಾ ದಾಖಲೆ.
- Accumulated lessons: ಏಜೆಂಟ್ ಪ್ರತಿ ಸೆಷನ್ನ ಆರಂಭದಲ್ಲಿ ಓದುವ ಪ್ರಮುಖ ನಿಯಮಗಳು.
- Corrections: ಇತ್ತೀಚಿನ ತಿದ್ದುಪಡಿಗಳಿಗಾಗಿ ಒಂದು ಸ್ಥಳ. ಒಂದು ವೇಳೆ ಎರಡು ವಾರಗಳಲ್ಲಿ ಒಂದು ತಪ್ಪು ಮೂರು ಬಾರಿ ಸಂಭವಿಸಿದರೆ, ಅದು ಶಾಶ್ವತ ಪಾಠಗಳ (permanent lessons) ಫೈಲ್ಗೆ ವರ್ಗಾಯಿಸಲ್ಪಡುತ್ತದೆ.
ಫಲಿತಾಂಶಗಳು ತಕ್ಷಣವೇ ಸಿಗಲಿಲ್ಲ. ಮೊದಲ ಮೂರು ವಾರಗಳವರೆಗೆ, ಗಮನಿಸಿದ ವಿಷಯಗಳು ಬಹಳ ಸಾಮಾನ್ಯವಾಗಿದ್ದವು. ನಾಲ್ಕನೇ ವಾರದ ವೇಳೆಗೆ, ಏಜೆಂಟ್ ಆಳವಾದ ಸಮಸ್ಯೆಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಿತು. ನಾನು ಗಮನಿಸದ ಸಮಯದ ದೋಷಗಳು (timing errors) ಮತ್ತು ಎರರ್ ಮೆಸೇಜ್ಗಳಲ್ಲಿನ ಗುಪ್ತ ಮಾದರಿಗಳನ್ನು ಅದು ಪತ್ತೆಹಚ್ಚಿತು.
ಇದರ ದೊಡ್ಡ ಪ್ರಯೋಜನವೆಂದರೆ ಸ್ಥಿರತೆ (stability). ನಾನು ಒಂದು ಸಮಸ್ಯೆಯನ್ನು ಸರಿಪಡಿಸಿದ ನಂತರ ಅದು ಮತ್ತೆ ಮರುಕಳಿಸಿದರೆ, ನನ್ನ ಪರಿಹಾರ ತಪ್ಪಾಗಿದೆ ಎಂದು ನನಗೆ ತಿಳಿಯುತ್ತದೆ. ಒಂದು ಪರಿಹಾರವು ನಿಜವಾಗಿಯೂ ಕೆಲಸ ಮಾಡುತ್ತಿದೆಯೇ ಎಂಬುದನ್ನು ಸಿಸ್ಟಮ್ ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತದೆ.
ಈ ಸಿಸ್ಟಮ್ಗೆ ಮಿತಿಗಳಿವೆ. ಇದು ಲಾಗ್ಗಳಲ್ಲಿನ ವೈಫಲ್ಯಗಳನ್ನು ನೋಡಬಲ್ಲದು, ಆದರೆ ನಾನು ಸೂಚಿಸದ ಹೊರತು ತೀರ್ಮಾನಗಳಲ್ಲಿನ ತಪ್ಪುಗಳನ್ನು (errors in judgment) ನೋಡಲು ಸಾಧ್ಯವಿಲ್ಲ. ಸರಿಯಾದ ಕಾರಣಗಳಿಗಾಗಿ ತಪ್ಪು ಕೆಲಸ ಮಾಡಿದಾಗ ನಾನು ಇನ್ನೂ ಅದಕ್ಕೆ ತಿಳಿಸಬೇಕಾಗುತ್ತದೆ.
ಈ ಸೆಟಪ್ ಕೇವಲ 50 ಸಾಲುಗಳ ಕಾನ್ಫಿಗರೇಶನ್ ಅನ್ನು ಬಳಸುತ್ತದೆ ಮತ್ತು ಎರಡು ನಿಮಿಷಗಳಿಗಿಂತ ಕಡಿಮೆ ಸಮಯದಲ್ಲಿ ರನ್ ಆಗುತ್ತದೆ. ಇದು ಪ್ರತಿದಿನ ನನ್ನ ಏಜೆಂಟ್ ಅನ್ನು ಸ್ವಲ್ಪ ಮಟ್ಟಿಗೆ ಉತ್ತಮಗೊಳಿಸುತ್ತದೆ.
Optional learning community: https://t.me/GyaanSetuAi