একটি শেয়ার্ড রেকর্ড ছাড়া AI ইনসিডেন্ট ম্যানেজমেন্ট ব্যর্থ হয়
AI এজেন্টরা ইনসিডেন্ট রেসপন্স (incident response) ক্ষেত্রে প্রবেশ করছে।
LangChain, PagerDuty, এবং New Relic-এর মতো কোম্পানিগুলো SRE এজেন্ট তৈরি করছে। এই টুলগুলো ট্রেস (traces) পড়তে পারে, লগ (logs) সংগ্রহ করতে পারে এবং আপডেটের খসড়া তৈরি করতে পারে। এগুলো দ্রুত কাজ করে এবং চমৎকার কনটেক্সট (context) প্রদান করে।
কিন্তু এখানে একটি ফাঁদ রয়েছে।
অনেক টিম AI কনটেক্সটকে একটি ব্যক্তিগত স্ক্র্যাচপ্যাড হিসেবে ব্যবহার করে। তারা রুট কজ (root cause) বা মূল কারণ খুঁজে বের করার মতো প্রশমনমূলক (mitigation) কাজের জন্য AI ব্যবহার করে। কিন্তু তারা কোঅর্ডিনেশন বা সমন্বয়ের কাজটিকে ভুলে যায়।
ইনসিডেন্ট ম্যানেজমেন্ট মানে কেবল কারণ খুঁজে বের করা নয়। এটি সমন্বয়ের বিষয়। এটি মানুষকে নিচের বিষয়গুলোতে একমত করার বিষয়:
- কী ঘটেছে।
- কী পরিবর্তন হয়েছে।
- আপনি কোন বিষয়গুলোকে নাকচ করে দিয়েছেন।
- পরবর্তী পদক্ষেপের দায়িত্ব কার।
- ব্যবসার বা স্টেকহোল্ডারদের কী জানা প্রয়োজন।
যদি এই তথ্যগুলো কোনো ব্যক্তিগত চ্যাট বা এজেন্টের নোটে থেকে যায়, তবে পুরো প্রক্রিয়াটি ব্যর্থ হয়।
একটি কার্যকর AI ইনসিডেন্ট রেকর্ড কেবল একটি চ্যাট লগ নয়। এটি একটি স্ট্রাকচার্ড অপারেশনাল অবজেক্ট (structured operational object)। এতে অবশ্যই অন্তর্ভুক্ত থাকতে হবে:
- ট্রিগার (alert, service, severity)।
- প্রমাণ (traces, logs, metrics, recent deploys)।
- হাইপোথিসিস বা অনুমিত সিদ্ধান্ত (কী ঘটছে বলে আপনি মনে করছেন এবং কেন)।
- প্রত্যাখ্যাত তত্ত্ব (আপনি যা প্রমাণ করেছেন যে এটি কারণ নয়)।
- সিদ্ধান্ত এবং অনুমোদন (কেন আপনি রোলব্যাক বা অপেক্ষা করার সিদ্ধান্ত নিয়েছেন)।
এই কাঠামোটি AI-এর একটি সাধারণ ব্যর্থতা রোধ করে। একটি এজেন্ট 'গ্র্যাভিটি ওয়েল' (gravity well)-এর মতো হয়ে যেতে পারে। এটি একটি সম্ভাব্য কারণ খুঁজে পায় এবং সেখানেই আটকে থাকে। এরপর এটি সেই একটি তত্ত্বকেই সমর্থন করার জন্য সমস্ত নতুন ডেটা ব্যাখ্যা করতে থাকে।
একটি শেয়ার্ড এবং স্ট্রাকচার্ড রেকর্ড টিমকে বিপরীত বা অসমর্থনকারী প্রমাণের দিকে তাকাতে বাধ্য করে। এটি এজেন্টের পক্ষপাতিত্ব (bias) নিয়ন্ত্রণে রাখে।
রেসপন্ডারদের আরও অপ্রাসঙ্গিক তথ্যের (noise) প্রয়োজন নেই। তাদের প্রয়োজন একটি শেয়ার্ড স্টেট (shared state)। যখন কোনো নতুন ব্যক্তি একটি ইনসিডেন্টে যোগ দেন, তখন তাকে Slack-এ পাঁচ মিনিট খুঁটিয়ে খুঁজতে হওয়া উচিত নয়। তাকে তাৎক্ষণিকভাবে বর্তমান হাইপোথিসিস, প্রমাণ এবং পেন্ডিং অ্যাকশনগুলো দেখতে পাওয়া উচিত।
লক্ষ্য কোনো চাকচিক্যময় ডেমো দেওয়া স্বয়ংক্রিয় রেসপন্ডার তৈরি করা নয়। লক্ষ্য হলো এমন একটি টুল তৈরি করা যা প্রাতিষ্ঠানিক জ্ঞান (institutional knowledge) রেখে যায়।
সবচেয়ে বুদ্ধিমান মডেল খোঁজা বন্ধ করুন। একটি স্ট্রাকচার্ড রেকর্ড তৈরি করা শুরু করুন।
- ইনসিডেন্টের জন্য সুনির্দিষ্ট ফিল্ড নির্ধারণ করুন।
- এজেন্টদের এই রেকর্ডে নিরাপদে পড়া এবং লেখার সুযোগ দিন।
- নিশ্চিত করুন যে রেকর্ডটি কেবল ডেটা নয়, বরং সিদ্ধান্তগুলোকেও নথিভুক্ত করে।
- ইনসিডেন্টের বিশৃঙ্খলাকে পুনরায় ব্যবহারযোগ্য জ্ঞানে রূপান্তর করতে এই রেকর্ডটি ব্যবহার করুন।
সেরা AI টুল হলো সেটি, যা মানুষের টিমকে একটি একক সত্তার মতো কাজ করতে সাহায্য করে।
ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi
