ನನ್ನ ಏಜೆಂಟ್ 12 ಎಂದು ವರದಿ ಮಾಡಿತು. ನಿಜವಾದ ಸಂಖ್ಯೆ 13 ಆಗಿತ್ತು.
ನಾನು ಸ್ಥಳೀಯವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಕೋಡಿಂಗ್ ಏಜೆಂಟ್ ಅನ್ನು ನಿರ್ಮಿಸುತ್ತಿದ್ದೇನೆ. ಇದು ಯೋಜನೆಗಾಗಿ Claude ಅನ್ನು ಮತ್ತು ಕೋಡ್ ಜನರೇಷನ್ ಗಾಗಿ ಸ್ಥಳೀಯ ಮಾಡೆಲ್ಗಳನ್ನು ಬಳಸುತ್ತದೆ. ಇತ್ತೀಚೆಗೆ, ನಾನು ಒಂದು ಸರಳ ಕೆಲಸವನ್ನು ಏಜೆಂಟ್ಗೆ ವಹಿಸಿಕೊಟ್ಟೆ: ನಿರ್ದಿಷ್ಟ ಲಾಗ್ಗಳನ್ನು ಎಣಿಸುವುದು.
ಏಜೆಂಟ್ 12 ಎಂದು ವರದಿ ಮಾಡಿತು. ಮ್ಯಾನುಯಲ್ ಬುಕ್ಕೀಪಿಂಗ್ ಮಾಡುವುದು ನನಗೆ ಸುಸ್ತಾಗಿದ್ದರಿಂದ, ನಾನು ಅದನ್ನು ಒಪ್ಪಿಕೊಳ್ಳುವ ಹಂತದಲ್ಲಿದ್ದೆ. ನಂತರ ನಾನು ನನ್ನ ಟರ್ಮಿನಲ್ನಲ್ಲಿ ಮ್ಯಾನುಯಲ್ ಚೆಕ್ ಮಾಡಿದೆ. ನಿಜವಾದ ಎಣಿಕೆ 13 ಆಗಿತ್ತು.
ಒಂದು ಎಂಟ್ರಿ ಅಸಮರ್ಪಕ ಆಕಾರವನ್ನು ಹೊಂದಿದ್ದರಿಂದ ಏಜೆಂಟ್ ಅದನ್ನು ತಪ್ಪಿಸಿತು. ಏಜೆಂಟ್ ಹ್ಯಾಲ್ಯುಸಿನೇಟ್ ಮಾಡುತ್ತಿರಲಿಲ್ಲ. ಅದು ಕೇವಲ "ಬಹುತೇಕ ಸರಿಯಾಗಿತ್ತು". ಇದು ಅತ್ಯಂತ ಅಪಾಯಕಾರಿ ರೀತಿಯ ದೋಷವಾಗಿದೆ. ಇದು ನಂಬಲು ಸಾಕಾಗುವಷ್ಟು ಸಮಂಜಸವಾಗಿ ಕಾಣುತ್ತದೆ.
ಇನ್ನೂ ಕೆಟ್ಟದೇನೆಂದರೆ, ಅಂತಿಮ ಸಾರಾಂಶ ಮೆಟ್ರಿಕ್ ಸರಿಯಾಗಿ ಕಾಣುತ್ತಿತ್ತು. ರೌಂಡಿಂಗ್ ಮತ್ತು ಗ್ರೂಪಿಂಗ್ ಹಂತಗಳು ತಪ್ಪನ್ನು ಮರೆಮಾಚಿದ್ದವು. ನಾನು ಕೇವಲ ಅಂತಿಮ ವರದಿಯನ್ನು ಮಾತ್ರ ನೋಡಿದ್ದರೆ, ಯಾವುದೇ ದೋಷ ಕಾಣಿಸುತ್ತಿರಲಿಲ್ಲ. ಆದರೆ ಕಚ್ಚಾ ಡೇಟಾ ತಪ್ಪಾಗಿತ್ತು. ಒಮ್ಮೆ ನಿಮ್ಮ ಕಚ್ಚಾ ಅಳತೆ ತಪ್ಪಾದರೆ, ಮುಂದಿನ ಪ್ರತಿಯೊಂದು ವರದಿಯು ಆ ತಪ್ಪನ್ನೇ ಒಳಗೊಂಡಿರುತ್ತದೆ.
ನಂಬಿಕೆ ಮತ್ತು ಅಳತೆಯ ಬಗ್ಗೆ ನಾನು ಕಠಿಣ ಪಾಠವನ್ನು ಕಲಿತೆ.
ಕೆಲಸ ಮಾಡುವ ವ್ಯವಸ್ಥೆಯೇ ಆ ಕೆಲಸವನ್ನು ನಿರ್ಣಯಿಸಲು ಬಿಟ್ಟರೆ, ನಿಮಗೆ ಸಮಸ್ಯೆ ಉಂಟಾಗುತ್ತದೆ. ನೀವು ಪರೀಕ್ಷಾರ್ಥಿಯನ್ನೇ ಪರೀಕ್ಷಕನನ್ನಾಗಿ ಮಾಡಿದ್ದೀರಿ ಎಂದರ್ಥ. ಪ್ರೊಬಾಬಿಲಿಸ್ಟಿಕ್ ಮಾಡೆಲ್ ಎಂದಿಗೂ ನಿಮ್ಮ ಏಕೈಕ ಸತ್ಯದ ಮೂಲವಾಗಬಾರದು.
ನಾನು ಈಗ ಎರಡು ಹೊಸ ನಿಯಮಗಳನ್ನು ಅನುಸರಿಸುತ್ತಿದ್ದೇನೆ:
ಮನುಷ್ಯನು ಮೊದಲು ಆಟೊಮೇಷನ್ ಅನ್ನು ಗಮನಿಸಬೇಕು. ಸ್ವಯಂ-ಅಳತೆ ಮಾಡುವ ವ್ಯವಸ್ಥೆಯನ್ನು ನಂಬುವ ಮೊದಲು, ನಾನು ಸ್ವತಃ ಡೆಟರ್ಮಿನಿಸ್ಟಿಕ್ ಎಣಿಕೆಯನ್ನು ಮಾಡುತ್ತೇನೆ. ಟರ್ಮಿನಲ್ನಲ್ಲಿ ಸಂಖ್ಯೆಗಳು ಹೇಗೆ ಬರುತ್ತಿವೆ ಎಂದು ನಾನು ಗಮನಿಸುತ್ತೇನೆ. ಯಂತ್ರ ಮತ್ತು ಮನುಷ್ಯ ಅನೇಕ ಬಾರಿ ಪೂರ್ಣವಾಗಿ ಹೊಂದಿಕೆಯಾದ ನಂತರವಷ್ಟೇ ನಾನು ಈ ನಿಯಮವನ್ನು ಸಡಿಲಿಸುತ್ತೇನೆ.
ಅಳತೆಗಳನ್ನು ಗಮನಿಸಬಹುದಾದ ಘಟಕಗಳಿಗೆ ಸ್ಥಿರಗೊಳಿಸಿ. ಮನುಷ್ಯನು ನೋಡಬಹುದಾದದ್ದನ್ನೇ ಏಜೆಂಟ್ ನಿಖರವಾಗಿ ಎಣಿಸುತ್ತಿದೆಯೇ ಎಂದು ನಾನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳುತ್ತೇನೆ. ಡೇಟಾ ಸೆಟ್ ಅಸ್ಪಷ್ಟವಾಗಿದ್ದರೆ, ಸಂಖ್ಯೆಗಳು ಬದಲಾಗುತ್ತಾ ಹೋಗುತ್ತವೆ. ಡೇಟಾ ನಿಖರವಾಗಿದ್ದರೆ, ನಾವು ಫಲಿತಾಂಶಗಳನ್ನು ವಾಸ್ತವವಾಗಿ ಹೋಲಿಸಬಹುದು.
ಈ ವಿಧಾನವು ನಿಧಾನವಾಗಿದೆ. ಇದು ಸದಾ ಕಾಲ ಸ್ಕೇಲ್ ಆಗುವುದಿಲ್ಲ. ಆದರೆ ನಂಬಿಕೆಯ ಅಡಿಪಾಯವನ್ನು ನಿರ್ಮಿಸುವುದು ಹೀಗೆಯೇ.
ನೀವು AI ಅನ್ನು ಕೋಡ್ ಬರೆಯಲು ಬಿಡಬಹುದು. ನೀವು AI ಅನ್ನು ವಿಶ್ಲೇಷಣೆ ಮಾಡಲು ಬಿಡಬಹುದು. ಆದರೆ ಮುಖ್ಯವಾದ ಸಂಖ್ಯೆಗಳ ವಿಷಯದಲ್ಲಿ, ಡೆಟರ್ಮಿನಿಸ್ಟಿಕ್ ಪ್ರಕ್ರಿಯೆಯೇ ಅಂತಿಮ ಸಾಕ್ಷಿಯಾಗಬೇಕು.
ನೀವು ಮಿತಿ ಎಲ್ಲಿ ಎಳೆಯುತ್ತೀರಿ? ಒಂದು ಸಂಖ್ಯೆಯನ್ನು ಕೈಯಿಂದ ಪರಿಶೀಲಿಸಲು ಬೇಕಾದಷ್ಟು ಮುಖ್ಯ ಎಂದು ನೀವು ಯಾವಾಗ ನಿರ್ಧರಿಸುತ್ತೀರಿ?
ಮೂಲ: https://dev.to/josephyeo/my-agent-reported-12-the-real-number-was-13-5864
ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi
