ಹಂಚಿಕೆಯ ದಾಖಲೆಯಿಲ್ಲದೆ AI ಇನ್ಸಿಡೆಂಟ್ ಮ್ಯಾನೇಜ್‌ಮೆಂಟ್ ವಿಫಲವಾಗುತ್ತದೆ

AI ಏಜೆಂಟ್‌ಗಳು ಇನ್ಸಿಡೆಂಟ್ ರೆಸ್ಪಾನ್ಸ್ (incident response) ಕ್ಷೇತ್ರಕ್ಕೆ ಪ್ರವೇಶಿಸುತ್ತಿವೆ.

LangChain, PagerDuty, ಮತ್ತು New Relic ನಂತಹ ಕಂಪನಿಗಳು SRE ಏಜೆಂಟ್‌ಗಳನ್ನು ನಿರ್ಮಿಸುತ್ತಿವೆ. ಈ ಪರಿಕರಗಳು traces ಓದಬಲ್ಲವು, logs ಪಡೆಯಬಲ್ಲವು ಮತ್ತು updates ಸಿದ್ಧಪಡಿಸಬಲ್ಲವು. ಅವು ವೇಗವಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ ಮತ್ತು ಉತ್ತಮ context ಒದಗಿಸುತ್ತವೆ.

ಆದರೆ ಇಲ್ಲಿ ಒಂದು ಬಲೆ ಇದೆ.

ಅನೇಕ ತಂಡಗಳು AI context ಅನ್ನು ಒಂದು ಖಾಸಗಿ scratchpad ನಂತೆ ಪರಿಗಣಿಸುತ್ತವೆ. ಅವರು root cause ಹುಡುಕುವಂತಹ mitigation ಕೆಲಸಗಳಿಗಾಗಿ AI ಅನ್ನು ಬಳಸುತ್ತಾರೆ. ಆದರೆ coordination ಕೆಲಸವನ್ನು ಮರೆತುಬಿಡುತ್ತಾರೆ.

ಇನ್ಸಿಡೆಂಟ್ ಮ್ಯಾನೇಜ್‌ಮೆಂಟ್ ಎಂದರೆ ಕೇವಲ ಕಾರಣವನ್ನು ಹುಡುಕುವುದಲ್ಲ. ಇದು ಸಮನ್ವಯದ (coordination) ಬಗ್ಗೆಯಾಗಿದೆ. ಇದು ಈ ಕೆಳಗಿನ ವಿಷಯಗಳ ಬಗ್ಗೆ ಜನರು ಒಮ್ಮತಕ್ಕೆ ಬರುವ ಬಗ್ಗೆಯಾಗಿದೆ:

  • ಏನಾಯಿತು.
  • ಏನದು ಬದಲಾಯಿತು.
  • ನೀವು ಯಾವುದನ್ನು ಕೈಬಿಟ್ಟಿದ್ದೀರಿ (ruled out).
  • ಮುಂದಿನ ಹಂತದ ಜವಾಬ್ದಾರಿ ಯಾರದ್ದು.
  • ವ್ಯವಹಾರಕ್ಕೆ (business) ಏನು ತಿಳಿಯಬೇಕಿದೆ.

ಈ ಮಾಹಿತಿ ಒಂದು ಖಾಸಗಿ ಚಾಟ್ ಅಥವಾ ಏಜೆಂಟ್‌ನ ನೋಟ್ಸ್‌ಗಳಲ್ಲಿ ಉಳಿದರೆ, ಪ್ರಕ್ರಿಯೆಯು ವಿಫಲವಾಗುತ್ತದೆ.

ಉಪಯುಕ್ತವಾದ AI ಇನ್ಸಿಡೆಂಟ್ ದಾಖಲೆಯು ಕೇವಲ ಚಾಟ್ ಲಾಗ್ ಅಲ್ಲ. ಅದು ಒಂದು ರಚನಾತ್ಮಕ ಕಾರ್ಯಾಚರಣಾ ವಸ್ತುವಾಗಿದೆ (structured operational object). ಅದರಲ್ಲಿ ಇವು ಇರಲೇಬೇಕು:

  • The trigger (alert, service, severity).
  • Evidence (traces, logs, metrics, ಇತ್ತೀಚಿನ deploys).
  • Hypotheses (ಏನಾಗುತ್ತಿದೆ ಮತ್ತು ಏಕೆ ಎಂದು ನೀವು ಭಾವಿಸುತ್ತೀರಿ).
  • Rejected theories (ಯಾವುದು ಕಾರಣವಲ್ಲ ಎಂದು ನೀವು ಸಾಬೀತುಪಡಿಸಿದ್ದೀರಿ).
  • Decisions and approvals (ನೀವು ಏಕೆ roll back ಮಾಡಲು ಅಥವಾ ಕಾಯಲು ನಿರ್ಧರಿಸಿದ್ದೀರಿ).

ಈ ರಚನೆಯು ಸಾಮಾನ್ಯ AI ವೈಫಲ್ಯವನ್ನು ತಡೆಯುತ್ತದೆ. ಒಂದು ಏಜೆಂಟ್ 'gravity well' ಆಗಬಹುದು. ಅದು ಒಂದು ಸಂಭವನೀಯ ಕಾರಣವನ್ನು ಕಂಡುಹಿಡಿದು ಅದರಲ್ಲೇ ಸಿಲುಕಿಕೊಳ್ಳಬಹುದು. ನಂತರ ಅದು ಆ ಒಂದು ಸಿದ್ಧಾಂತವನ್ನು ಬೆಂಬಲಿಸಲು ಎಲ್ಲಾ ಹೊಸ ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸುತ್ತದೆ.

ಹಂಚಿಕೆಯಾದ, ರಚನಾತ್ಮಕ ದಾಖಲೆಯು ತಂಡವು disconfirming evidence ಅನ್ನು ನೋಡುವಂತೆ ಮಾಡುತ್ತದೆ. ಇದು ಏಜೆಂಟ್‌ನ bias ಅನ್ನು ನಿಯಂತ್ರಣದಲ್ಲಿಡುತ್ತದೆ.

Responders ಗೆ ಹೆಚ್ಚಿನ ಗೊಂದಲದ ಅಗತ್ಯವಿಲ್ಲ. ಅವರಿಗೆ ಒಂದು shared state ಬೇಕು. ಒಬ್ಬ ಹೊಸ ವ್ಯಕ್ತಿಯು ಇನ್ಸಿಡೆಂಟ್‌ಗೆ ಸೇರಿದಾಗ, ಅವರು Slack ನಲ್ಲಿ ಐದು ನಿಮಿಷಗಳ ಕಾಲ ಹುಡುಕುವ ಅವಶ್ಯಕತೆ ಇರಬಾರದು. ಅವರು ಪ್ರಸ್ತುತ hypothesis, evidence ಮತ್ತು ಬಾಕಿ ಇರುವ ಕ್ರಮಗಳನ್ನು ತಕ್ಷಣವೇ ನೋಡಲು ಸಾಧ್ಯವಾಗಬೇಕು.

ಗುರಿಯು ಕೇವಲ ಆಕರ್ಷಕ ಡೆಮೊ ಹೊಂದಿರುವ ಒಂದು autonomous responder ಅಲ್ಲ. ಗುರಿಯು ಸಾಂಸ್ಥಿಕ ಜ್ಞಾನವನ್ನು (institutional knowledge) ಉಳಿಸುವ ಒಂದು ಪರಿಕರವಾಗಿದೆ.

ಅತ್ಯಂತ ಚತುರವಾದ ಮಾಡೆಲ್‌ಗಾಗಿ ಹುಡುಕುವುದನ್ನು ನಿಲ್ಲಿಸಿ. ಒಂದು ರಚನಾತ್ಮಕ ದಾಖಲೆಯನ್ನು ನಿರ್ಮಿಸಲು ಪ್ರಾರಂಭಿಸಿ.

  • ಇನ್ಸಿಡೆಂಟ್‌ಗಳಿಗಾಗಿ ಸ್ಪಷ್ಟವಾದ ಫೀಲ್ಡ್‌ಗಳನ್ನು ವ್ಯಾಖ್ಯಾನಿಸಿ.
  • ಏಜೆಂಟ್‌ಗಳು ಈ ದಾಖಲೆಯನ್ನು ಸುರಕ್ಷಿತವಾಗಿ ಓದಲು ಮತ್ತು ಬರೆಯಲು ಅವಕಾಶ ನೀಡಿ.
  • ದಾಖಲೆಯು ಕೇವಲ ಡೇಟಾವನ್ನು ಮಾತ್ರವಲ್ಲದೆ ನಿರ್ಧಾರಗಳನ್ನು ಸಹ ಸೆರೆಹಿಡಿಯುವುದನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.
  • ಇನ್ಸಿಡೆಂಟ್ ಗೊಂದಲವನ್ನು ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ ಜ್ಞಾನವಾಗಿ ಪರಿವರ್ತಿಸಲು ಈ ದಾಖಲೆಯನ್ನು ಬಳಸಿ.

ಅತ್ಯುತ್ತಮ AI ಪರಿಕರವೆಂದರೆ ಮಾನವ ತಂಡವನ್ನು ಒಂದಾಗಿ ಕೆಲಸ ಮಾಡುವಂತೆ ಮಾಡುವ ಪರಿಕರ.

Source: https://dev.to/focused_dot_io/ai-incident-management-breaks-without-a-shared-record-focused-labs-1og5

Optional learning community: https://t.me/GyaanSetuAi