ಚಾಟ್‌ಬಾಟ್‌ಗಳ ಆಚೆಗೆ: AI ಕೇವಲ ಉತ್ತರಿಸುವುದರಿಂದ ಕಾರ್ಯಗತಗೊಳಿಸುವತ್ತ ಏಕೆ ಬದಲಾಗಬೇಕು

ಪ್ರತಿಕ್ರಿಯಾತ್ಮಕ (reactive) AI ಯುಗವು ಅಂತ್ಯಗೊಳ್ಳುತ್ತಿದೆ. ನಾವು ಕೇವಲ ಸಮಂಜಸವಾದ ಪಠ್ಯವನ್ನು ಸೃಷ್ಟಿಸುವ Large Language Models (LLMs) ನಿಂದ, ಸ್ಥಿರವಾದ ಡಿಜಿಟಲ್ ಪರಿಸರಗಳಲ್ಲಿ ಸಂಕೀರ್ಣವಾದ, ಬಹು-ಹಂತದ ಕಾರ್ಯವಿಧಾನಗಳನ್ನು (workflows) ಕಾರ್ಯಗತಗೊಳಿಸುವ ಸ್ವಾಯತ್ತ ಏಜೆಂಟ್‌ಗಳತ್ತ (autonomous agents) ಸಾಗುತ್ತಿದ್ದೇವೆ.

ವೇಗದ ಅಂತಃಪ್ರಜ್ಞೆಯಿಂದ ನಿಧಾನಗತಿಯ ತರ್ಕದವರೆಗೆ

AI ನ ಪ್ರಸ್ತುತ ವಿಕಸನವು ಕಂಪ್ಯೂಟೇಶನಲ್ ಲಾಜಿಕ್‌ನಲ್ಲಿನ ಮೂಲಭೂತ ಬದಲಾವಣೆಯಿಂದ ವ್ಯಾಖ್ಯಾನಿಸಲ್ಪಟ್ಟಿದೆ. ಸಾಂಪ್ರದಾಯಿಕ ಚಾಟ್‌ಬಾಟ್‌ಗಳು "System 1" ಆಲೋಚನೆಯ ಮೇಲೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತಿದ್ದವು—ಅವು ವೇಗವಾಗಿ, ಅಂತಃಪ್ರಜ್ಞೆಯುಳ್ಳ ಮತ್ತು ಸಾಂಖ್ಯಿಕ ಸಂಭವನೀಯತೆಯ (statistical probability) ಆಧಾರದ ಮೇಲೆ ಟೋಕನ್-ಬೈ-ಟೋಕನ್ ಪಠ್ಯವನ್ನು ಸೃಷ್ಟಿಸುತ್ತಿದ್ದವು. ಈ ಮಾದರಿಗಳು ತಕ್ಷಣದ ಉತ್ತರಗಳನ್ನು ನೀಡುತ್ತಿದ್ದವು, ಆದರೆ ತಮ್ಮ ಸ್ವಂತ ತರ್ಕವನ್ನು ಪರಿಶೀಲಿಸುವ ಅಥವಾ ಮಧ್ಯದಲ್ಲಿ ತಪ್ಪುಗಳನ್ನು ತಿದ್ದಿಕೊಳ್ಳುವ ಸಾಮರ್ಥ್ಯವನ್ನು ಹೊಂದಿರಲಿಲ್ಲ.

OpenAI ನ o1 ಮತ್ತು DeepSeek-R1 ನಂತಹ ಮಾದರಿಗಳ ನೇತೃತ್ವದಲ್ಲಿ ಉದಯಿಸುತ್ತಿರುವ "thinking LLMs", "System 2" ತರ್ಕವನ್ನು ಪರಿಚಯಿಸಿವೆ. ಇನ್ಫರೆನ್ಸ್ ಸಮಯದಲ್ಲಿ (inference time) ಹೆಚ್ಚಿನ ಕಂಪ್ಯೂಟ್ ಶಕ್ತಿಯನ್ನು ಬಳಸುವ ಮೂಲಕ, ಈ ಮಾದರಿಗಳು ದೀರ್ಘವಾದ ಆಲೋಚನಾ ಸರಪಳಿಗಳನ್ನು (chains of thought) ಸೃಷ್ಟಿಸಲು reinforcement learning ಅನ್ನು ಬಳಸುತ್ತವೆ. ಅವು ಪರಿಹಾರದ ಹಾದಿಗಳನ್ನು ಅನ್ವೇಷಿಸುತ್ತವೆ, ಮಧ್ಯಂತರ ಹಂತಗಳನ್ನು ಪರಿಶೀಲಿಸುತ್ತವೆ ಮತ್ತು ಸ್ವಯಂ-ತಿದ್ದುಪಡಿ ಮಾಡಿಕೊಳ್ಳುತ್ತವೆ, ಇದರಿಂದಾಗಿ ಪರಿಶೀಲಿಸಬಹುದಾದ ಸರಿಯಾದ ಪರಿಹಾರಗಳು ಮಾತ್ರ ಪ್ರಸ್ತುತಪಡಿಸಲ್ಪಡುತ್ತವೆ. ಈ ಪರಿವರ್ತನೆಯು ಒಂದು ಮಾದರಿಯನ್ನು ಸರ್ಚ್ ಇಂಜಿನ್ ಪರ್ಯಾಯದಿಂದ ತರ್ಕದ ಇಂಜಿನ್ ಆಗಿ (reasoning engine) ಪರಿವರ್ತಿಸುವ ಮೊದಲ ಹೆಜ್ಜೆಯಾಗಿದೆ.

OpenClaw ಯುಗ: Workspace ಮತ್ತು Skill ಸಂಯೋಜನೆ

ತರ್ಕವು ನಿರ್ಣಾಯಕವಾಗಿದ್ದರೂ, ಕೇವಲ ತರ್ಕದಿಂದ ಕೆಲಸ ಪೂರ್ಣಗೊಳ್ಳುವುದಿಲ್ಲ. ಸಂಶೋಧಕರ ಪ್ರಕಾರ, ಮುಂದಿನ ದೊಡ್ಡ ಜಿಗಿತ—"OpenClaw" ಯುಗವು—ಅಸ್ಥಿರವಾದ, ಏಕಬಾರಿಗೊಳಿಸುವ ಟೂಲ್ ಕರೆಗಳಿಂದ (one-off tool calls) ಸ್ಥಿರವಾದ, ಸುರಕ್ಷಿತ ವರ್ಕ್‌ಸ್ಪೇಸ್‌ಗಳತ್ತ (workspaces) ಬದಲಾವಣೆಯನ್ನು ಬಯಸುತ್ತದೆ.

ಈ ಕ್ರಾಂತಿಯು Workspace ಮತ್ತು Skill ಗಳ ಸಂಯೋಜನೆಯಲ್ಲಿದೆ:

  • The Workspace: ಫೈಲ್‌ಗಳು, ಟರ್ಮಿನಲ್‌ಗಳು, ಲಾಗ್‌ಗಳು ಮತ್ತು ಬ್ರೌಸರ್‌ಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ಒಂದು ಸ್ಥಿರ ಪರಿಸರ. ಹಂತಗಳ ನಡುವೆ ಸಂದರ್ಭವನ್ನು (context) ಕಳೆದುಕೊಳ್ಳುತ್ತಿದ್ದ ಆರಂಭಿಕ ಏಜೆಂಟ್‌ಗಳಿಗಿಂತ ಭಿನ್ನವಾಗಿ, ವರ್ಕ್‌ಸ್ಪೇಸ್ "state" ಅನ್ನು ಒದಗಿಸುತ್ತದೆ, ಅಂದರೆ AI ಸ್ಥಿರವಾದ ಪರಿಸರದೊಂದಿಗೆ ಸಂವಹನ ನಡೆಸಬಹುದು ಮತ್ತು ಅಲ್ಲಿನ ಕ್ರಮಗಳು ದೀರ್ಘಕಾಲದ ಪರಿಣಾಮಗಳನ್ನು ಬೀರುತ್ತವೆ.
  • Skills: ಸರಳ ಪ್ರಾಂಪ್ಟ್‌ಗಳ ಆಚೆಗೆ ಹೋಗುವ "skills" ಎಂಬವು ಕಾರ್ಯಾಚರಣೆಯ ಜ್ಞಾನದ ಮಾಡ್ಯುಲರ್ ಮತ್ತು ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ ಕಟ್ಟುಗಳು. ಉದಾಹರಣೆಗೆ, Anthropic ನ Agent Skills, ಸೂಚನೆಗಳು ಮತ್ತು ಸ್ಕ್ರಿಪ್ಟ್‌ಗಳನ್ನು ಪ್ಯಾಕೇಜ್ ಮಾಡಲು SKILL.md ಫೈಲ್‌ಗಳನ್ನು ಬಳಸುತ್ತದೆ. ಇದು ಸಂಸ್ಥೆಗಳು ಪ್ರತಿ ಪ್ರಾಂಪ್ಟ್‌ನೊಂದಿಗೆ ಹೊಸದಾಗಿ ಕಾರ್ಯವಿಧಾನಗಳನ್ನು ರೂಪಿಸುವ ಬದಲು, ಸಾಂಸ್ಥಿಕ ಜ್ಞಾನವನ್ನು (institutional know-how) ಸುಲಭವಾಗಿ ವರ್ಗಾಯಿಸಬಹುದಾದ ರೂಪದಲ್ಲಿ ಉಳಿಸಿಕೊಳ್ಳಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ.

ಯಶಸ್ಸನ್ನು ಮರು ವ್ಯಾಖ್ಯಾನಿಸುವುದು: Task Closure vs. Answer Accuracy

AI ವರ್ಕ್‌ಸ್ಪೇಸ್‌ಗಳಿಗೆ ಪ್ರವೇಶಿಸುತ್ತಿದ್ದಂತೆ, "ಬುದ್ಧಿವಂತಿಕೆ"ಯ ಮಾನದಂಡಗಳು ಬದಲಾಗಬೇಕಿದೆ. ಚಾಟ್‌ಬಾಟ್ ಯುಗದಲ್ಲಿ, ಮಾದರಿಗಳನ್ನು ಅವುಗಳ ಪ್ರತಿಕ್ರಿಯೆಗಳ ನಿಖರತೆಯ ಆಧಾರದ ಮೇಲೆ ಅಳೆಯಲಾಗುತ್ತಿತ್ತು. ಏಜೆಂಟಿಕ್ ಯುಗದಲ್ಲಿ, ಯಶಸ್ಸನ್ನು task closure ಮೂಲಕ ಅಳೆಯಲಾಗುತ್ತದೆ: ಅಂದರೆ ಒಂದು ಗುರಿ ಪರಿಸರವನ್ನು (target environment) ಪರಿಶೀಲಿಸಬಹುದಾದ ಅಂತಿಮ ಸ್ಥಿತಿಗೆ ತರುವ ಸಾಮರ್ಥ್ಯ.

ಈ ಬದಲಾವಣೆಯು ಆಧುನಿಕ ಬೆಂಚ್‌ಮಾರ್ಕ್‌ಗಳ ಸಂಕೀರ್ಣತೆಯಿಂದ ಸಾಬೀತಾಗುತ್ತದೆ. GPT-4 ಪಠ್ಯದಲ್ಲಿ ಅತ್ಯುತ್ತಮವಾಗಿದ್ದರೂ, ನೈಜ ಪ್ರಪಂಚದ ವೆಬ್ ಪರಿಸರಗಳನ್ನು ಅನುಕರಿಸುವ WebArena ಬೆಂಚ್‌ಮಾರ್ಕ್‌ನಲ್ಲಿ ಆರಂಭದಲ್ಲಿ ಕೇವಲ 14% ಕಾರ್ಯಗಳನ್ನು ಪೂರ್ಣಗೊಳಿಸಿತು. ಈಗ ಯಶಸ್ಸು ಎಂದರೆ ಕೇವಲ ಅಂತಿಮ ಫಲಿತಾಂಶವನ್ನು ಓದುವುದಲ್ಲ, ಬದಲಾಗಿ "state-action-observation trajectories"—ಅಂದರೆ ಏಜೆಂಟ್ ಒಂದು ವ್ಯವಸ್ಥೆಯ ಮೂಲಕ ಹೇಗೆ ಚಲಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ಗಮನಿಸುವುದಾಗಿದೆ.

ಭದ್ರತೆ ಮತ್ತು ಆಡಳಿತದ ಹೊಸ ಮಿತಿಗಳು

ಹೆಚ್ಚಿದ ಸ್ವಾಯತ್ತತೆಯು ಹೆಚ್ಚಿದ ಅಪಾಯವನ್ನು ತರುತ್ತದೆ. ವರ್ಕ್‌ಸ್ಪೇಸ್ ಆಧಾರಿತ ಏಜೆಂಟ್‌ಗಳು ಕ್ರೆಡೆನ್ಶಿಯಲ್‌ಗಳು, ಐಡೆಂಟಿಟಿ ಟೋಕನ್‌ಗಳು ಮತ್ತು ಸೂಕ್ಷ್ಮ ರೆಪೊಸಿಟರಿಗಳ ಪ್ರವೇಶವನ್ನು ಹೊಂದಿರುವುದರಿಂದ, ಅವು AI ದಾಳಿಯ ವ್ಯಾಪ್ತಿಯನ್ನು (attack surface) ವಿಸ್ತರಿಸುತ್ತವೆ. OpenClaw PRISM ಮತ್ತು ClawGuard ನಂತಹ ಉದಯೋನ್ಮುಖ ಚೌಕಟ್ಟುಗಳು ಅನುಮತಿ ನಿಯಂತ್ರಣಗಳು, ಮೂಲದ ಟ್ರ್ಯಾಕಿಂಗ್ (provenance tracking) ಮತ್ತು ಸ್ಯಾಂಡ್‌ಬಾಕ್ಸಿಂಗ್ ಅನ್ನು ಒಳಗೊಂಡಿರುವ "harnesses"ಗಳನ್ನು ರಚಿಸುವತ್ತ ಗಮನ ಹರಿಸುತ್ತಿವೆ. AI ನಿಜವಾದ ಸಹೋದ್ಯೋಗಿಯಾಗಬೇಕಾದರೆ, ಏಜೆಂಟ್ ಮಾಡುವ ತಪ್ಪುವು ಶಾಶ್ವತವಾದ ವಾಸ್ತುಶಿಲ್ಪದ ದೋಷವಾಗದಂತೆ ನೋಡಿಕೊಳ್ಳಲು, ಡೆವಲಪರ್‌ಗಳು ರೋಲ್‌ಬ್ಯಾಕ್, ಡೇಟಾ ಸಾರ್ವಭೌಮತ್ವ ಮತ್ತು ವರ್ಕ್‌ಸ್ಪೇಸ್ ಹೈಜೀನ್‌ನ ಸಮಸ್ಯೆಗಳನ್ನು ಪರಿಹರಿಸಬೇಕಾಗುತ್ತದೆ.

ಪ್ರಮುಖ ಅಂಶಗಳು

  • Reasoning Shift: AI "System 1" (ವೇಗವಾದ, ಪ್ರತಿಕ್ರಿಯಾತ್ಮಕ) ನಿಂದ "System 2" (ನಿಧಾನಗತಿಯ, ವಿವೇಚನಾಶೀಲ) ತರ್ಕದತ್ತ ಸಾಗುತ್ತಿದೆ, ಮತ್ತು ಸ್ವಯಂ-ತಿದ್ದುಪಡಿಗಾಗಿ ಇನ್ಫರೆನ್ಸ್ ಸಮಯದಲ್ಲಿ ಹೆಚ್ಚಿನ ಕಂಪ್ಯೂಟ್ ಶಕ್ತಿಯನ್ನು ಬಳಸುತ್ತಿದೆ.
  • Workspace + Skill: ಕಾರ್ಯವಿಧಾನಗಳು ಪುನರಾವರ್ತಿತ ಮತ್ತು ವಿಸ್ತರಿಸಬಹುದಾದಂತೆ (scalable) ಮಾಡಲು, ನಿಜವಾದ ಸ್ವಾಯತ್ತತೆಗೆ ಮಾಡ್ಯುಲರ್ ಮತ್ತು ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ "skills"ಗಳೊಂದಿಗೆ ಸ್ಥಿರವಾದ ಡಿಜಿಟಲ್ ವರ್ಕ್‌ಸ್ಪೇಸ್ ಅಗತ್ಯವಿದೆ.
  • New Evaluation Metrics: ಯಶಸ್ಸು ಎಂಬುದು ಈಗ ಕೇವಲ ಪಠ್ಯ ಪ್ರತಿಕ್ರಿಯೆಯ ಸಮಂಜಸತೆಯ ಬಗ್ಗೆ ಅಲ್ಲ, ಬದಲಾಗಿ "task closure" ಬಗ್ಗೆಯಾಗಿದೆ—ಅಂದರೆ ಸಂಕೀರ್ಣ ಪರಿಸರದಲ್ಲಿ ಒಂದು ಕಾರ್ಯವಿಧಾನವನ್ನು ಪರಿಶೀಲಿಸಬಹುದಾದ ರೀತಿಯಲ್ಲಿ ಪೂರ್ಣಗೊಳಿಸುವುದು.