ಪ್ರತಿದಿನ ರಾತ್ರಿ ನಾನು ನನ್ನ ಏಜೆಂಟ್‌ನಲ್ಲಿ ಸ್ವಯಂ ಸುಧಾರಣಾ ಲೂಪ್ ಅನ್ನು ರನ್ ಮಾಡುತ್ತೇನೆ

📅3 hours ago⏱2 min read

𝗜 𝗥𝘂𝗻 𝗮 𝗦𝗲𝗹𝗳-𝗜𝗺𝗽𝗿𝗼𝘃𝗲𝗺𝗲𝗻𝘁 𝗟𝗼𝗼𝗽 𝗼𝗻 𝗺𝘆 𝗔𝗴𝗲𝗻𝘁 𝗘𝘃𝗲𝗿𝘆 𝗡𝗶𝗴𝗵𝘁

ನನ್ನ AI ಏಜೆಂಟ್ ಒಂದೇ ತಪ್ಪುಗಳನ್ನು ಪದೇ ಪದೇ ಮಾಡುತ್ತಿತ್ತು. ಅದು ಒಂದು ಕೆಲಸವನ್ನು ಮಾಡುತ್ತಿತ್ತು, ಮೌನವಾಗಿ ವಿಫಲವಾಗುತ್ತಿತ್ತು ಮತ್ತು ನಂತರ ಎಲ್ಲವೂ ಸರಿಯಾಗಿ ನಡೆದಿದೆ ಎಂದು ವರದಿ ಮಾಡುತ್ತಿತ್ತು. ಅದು ಕೆಟ್ಟು ಹೋಗಿರಲಿಲ್ಲ. ಅದಕ್ಕೆ ತನ್ನ ತಪ್ಪುಗಳಿಂದ ಕಲಿಯುವ ಮಾರ್ಗವೇ ಇರಲಿಲ್ಲ.

ಇದನ್ನು ಸರಿಪಡಿಸಲು ನಾನು ಒಂದು ಸ್ವಯಂ-ಸುಧಾರಣಾ ಲೂಪ್ (self-improvement loop) ಅನ್ನು ನಿರ್ಮಿಸಿದೆ.

ಪ್ರತಿದಿನ ರಾತ್ರಿ 2 ಗಂಟೆಗೆ, ಒಂದು ಪ್ರತ್ಯೇಕ ಸೆಷನ್ (isolated session) ಸಕ್ರಿಯವಾಗುತ್ತದೆ. ಅದು ಕಳೆದ 24 ಗಂಟೆಗಳ ಲಾಗ್‌ಗಳನ್ನು (logs) ಓದುತ್ತದೆ. ಏನಾಗಿದ್ದು, ಎಲ್ಲಿ ತಪ್ಪಾಗಿದೆ ಎಂಬ ಮಾದರಿಗಳನ್ನು (patterns) ಅದು ಪತ್ತೆಹಚ್ಚುತ್ತದೆ. ನಂತರ, ಅದು ಏಜೆಂಟ್‌ನ ಮೆಮೊರಿ ಫೈಲ್‌ಗಳನ್ನು ಅಪ್‌ಡೇಟ್ ಮಾಡುತ್ತದೆ. ಇದರಲ್ಲಿ ಯಾವುದೇ ಮನುಷ್ಯನ ಮಧ್ಯಸ್ಥಿಕೆ ಇರುವುದಿಲ್ಲ.

ಇದು ಹೇಗೆ ಕೆಲಸ ಮಾಡುತ್ತದೆ ಎಂಬುದು ಇಲ್ಲಿದೆ:

ಎಕ್ಸಿಕ್ಯೂಟರ್ (executor) ಮತ್ತು ಕ್ರಿಟಿಕ್ (critic) ಅನ್ನು ಪ್ರತ್ಯೇಕಿಸಿ. ಮುಖ್ಯ ಏಜೆಂಟ್ ಕೆಲಸಗಳನ್ನು ಮಾಡುತ್ತದೆ. ಪ್ರತ್ಯೇಕ ಸೆಷನ್ ಆ ಕೆಲಸವನ್ನು ಪರಿಶೀಲಿಸುತ್ತದೆ. ಒಂದು ಸೆಷನ್ ಒಂದೇ ಸಮಯದಲ್ಲಿ ತೀರ್ಪುಗಾರ ಮತ್ತು ನಿರ್ವಾಹಕ ಎರಡೂ ಆಗಲು ಸಾಧ್ಯವಿಲ್ಲ.
ಸರಳ ಫೈಲ್‌ಗಳನ್ನು ಬಳಸಿ. ಮೆಮೊರಿ ಮತ್ತು ತಿದ್ದುಪಡಿಗಳಿಗಾಗಿ ನಾನು ಪ್ಲೇನ್ ಟೆಕ್ಸ್ಟ್ ಫೈಲ್‌ಗಳನ್ನು ಬಳಸುತ್ತೇನೆ. ಇದು ಸಿಸ್ಟಮ್ ಅನ್ನು ಲೈಟ್‌ವೇಟ್ ಆಗಿಡುತ್ತದೆ.
ನಿರ್ದಿಷ್ಟತೆಯನ್ನು ಒತ್ತಿಹೇಳಿ. ನಾನು ಏಜೆಂಟ್‌ಗೆ ಸುಧಾರಿಸಿಕೊಳ್ಳಲು ಹೇಳುವುದಿಲ್ಲ. ಬದಲಾಗಿ, ಮಾದರಿಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು, ಪುರಾವೆಗಳನ್ನು ನೀಡಲು ಮತ್ತು ಒಂದು ನಿರ್ದಿಷ್ಟ ಪರಿಹಾರವನ್ನು ಸೂಚಿಸಲು ನಾನು ಕೇಳುತ್ತೇನೆ.

ಇದನ್ನು ನಿರ್ವಹಿಸಲು ನಾನು ಮೂರು ನಿರ್ದಿಷ್ಟ ಫೈಲ್‌ಗಳನ್ನು ಬಳಸುತ್ತೇನೆ:

Daily logs: ನಡೆದ ಪ್ರತಿಯೊಂದರ ಕಚ್ಚಾ ದಾಖಲೆ.
Accumulated lessons: ಏಜೆಂಟ್ ಪ್ರತಿ ಸೆಷನ್‌ನ ಆರಂಭದಲ್ಲಿ ಓದುವ ಪ್ರಮುಖ ನಿಯಮಗಳು.
Corrections: ಇತ್ತೀಚಿನ ತಿದ್ದುಪಡಿಗಳಿಗಾಗಿ ಒಂದು ಸ್ಥಳ. ಒಂದು ವೇಳೆ ಎರಡು ವಾರಗಳಲ್ಲಿ ಒಂದು ತಪ್ಪು ಮೂರು ಬಾರಿ ಸಂಭವಿಸಿದರೆ, ಅದು ಶಾಶ್ವತ ಪಾಠಗಳ (permanent lessons) ಫೈಲ್‌ಗೆ ವರ್ಗಾಯಿಸಲ್ಪಡುತ್ತದೆ.

ಫಲಿತಾಂಶಗಳು ತಕ್ಷಣವೇ ಸಿಗಲಿಲ್ಲ. ಮೊದಲ ಮೂರು ವಾರಗಳವರೆಗೆ, ಗಮನಿಸಿದ ವಿಷಯಗಳು ಬಹಳ ಸಾಮಾನ್ಯವಾಗಿದ್ದವು. ನಾಲ್ಕನೇ ವಾರದ ವೇಳೆಗೆ, ಏಜೆಂಟ್ ಆಳವಾದ ಸಮಸ್ಯೆಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಿತು. ನಾನು ಗಮನಿಸದ ಸಮಯದ ದೋಷಗಳು (timing errors) ಮತ್ತು ಎರರ್ ಮೆಸೇಜ್‌ಗಳಲ್ಲಿನ ಗುಪ್ತ ಮಾದರಿಗಳನ್ನು ಅದು ಪತ್ತೆಹಚ್ಚಿತು.

ಇದರ ದೊಡ್ಡ ಪ್ರಯೋಜನವೆಂದರೆ ಸ್ಥಿರತೆ (stability). ನಾನು ಒಂದು ಸಮಸ್ಯೆಯನ್ನು ಸರಿಪಡಿಸಿದ ನಂತರ ಅದು ಮತ್ತೆ ಮರುಕಳಿಸಿದರೆ, ನನ್ನ ಪರಿಹಾರ ತಪ್ಪಾಗಿದೆ ಎಂದು ನನಗೆ ತಿಳಿಯುತ್ತದೆ. ಒಂದು ಪರಿಹಾರವು ನಿಜವಾಗಿಯೂ ಕೆಲಸ ಮಾಡುತ್ತಿದೆಯೇ ಎಂಬುದನ್ನು ಸಿಸ್ಟಮ್ ಟ್ರ್ಯಾಕ್ ಮಾಡುತ್ತದೆ.

ಈ ಸಿಸ್ಟಮ್‌ಗೆ ಮಿತಿಗಳಿವೆ. ಇದು ಲಾಗ್‌ಗಳಲ್ಲಿನ ವೈಫಲ್ಯಗಳನ್ನು ನೋಡಬಲ್ಲದು, ಆದರೆ ನಾನು ಸೂಚಿಸದ ಹೊರತು ತೀರ್ಮಾನಗಳಲ್ಲಿನ ತಪ್ಪುಗಳನ್ನು (errors in judgment) ನೋಡಲು ಸಾಧ್ಯವಿಲ್ಲ. ಸರಿಯಾದ ಕಾರಣಗಳಿಗಾಗಿ ತಪ್ಪು ಕೆಲಸ ಮಾಡಿದಾಗ ನಾನು ಇನ್ನೂ ಅದಕ್ಕೆ ತಿಳಿಸಬೇಕಾಗುತ್ತದೆ.

ಈ ಸೆಟಪ್ ಕೇವಲ 50 ಸಾಲುಗಳ ಕಾನ್ಫಿಗರೇಶನ್ ಅನ್ನು ಬಳಸುತ್ತದೆ ಮತ್ತು ಎರಡು ನಿಮಿಷಗಳಿಗಿಂತ ಕಡಿಮೆ ಸಮಯದಲ್ಲಿ ರನ್ ಆಗುತ್ತದೆ. ಇದು ಪ್ರತಿದಿನ ನನ್ನ ಏಜೆಂಟ್ ಅನ್ನು ಸ್ವಲ್ಪ ಮಟ್ಟಿಗೆ ಉತ್ತಮಗೊಳಿಸುತ್ತದೆ.

Source: https://dev.to/mrclaw207/i-run-a-self-improvement-loop-on-my-openclaw-agent-every-night-heres-what-i-learned-38bp

Optional learning community: https://t.me/GyaanSetuAi

ಪ್ರತಿದಿನ ರಾತ್ರಿ ನಾನು ನನ್ನ ಏಜೆಂಟ್‌ನಲ್ಲಿ ಸ್ವಯಂ ಸುಧಾರಣಾ ಲೂಪ್ ಅನ್ನು ರನ್ ಮಾಡುತ್ತೇನೆ

Continue reading

𝗧𝗵𝗲 𝗕𝗹𝗶𝗻𝗱 𝗦𝗽𝗼𝘁 𝗢𝗳 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

ಸ್ವಾಯತ್ತ ಏಜೆಂಟ್ ತಂಡವನ್ನು ನಿರ್ಮಿಸುವುದು

𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝟳 𝗖𝗿𝗶𝘁𝗶𝗰𝗮𝗹 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

AI ಏಜೆಂಟ್‌ಗಳಿಗೆ ವಿಶ್ವಾಸಾರ್ಹತೆಯ ಸಮಸ್ಯೆ ಇದೆ