SRE با حضور انسان در چرخه

اتوماسیون سریع‌تر از انسان‌ها حرکت می‌کند.

در سال ۲۰۲۱، یک تغییر در پیکربندی Fastly باعث قطعی جهانی شد. اتوماسیون این خطا را در کمتر از یک دقیقه منتشر کرد. ۴۹ دقیقه طول کشید تا انسان‌ها آن را برطرف کنند.

این چالش اصلی SRE به کمک هوش مصنوعی است. هوش مصنوعی می‌تواند مشکلات را با سرعتی شناسایی و رفع کند که انسان‌ها قادر به رقابت با آن نیستند. خطر، تکنولوژی نیست؛ خطر، شکاف سرعت بین اقدامات خودکار و مسئولیت‌پذیری انسانی است.

شما باید یک سیاست ارتقای سطح (escalation policy) طراحی کنید تا مشخص شود کجا اتوماسیون پایان می‌یابد و قضاوت انسانی آغاز می‌شود.

از طیف خودمختاری اتوماسیون (Automation Autonomy Spectrum) برای مدیریت هوش مصنوعی خود استفاده کنید:

• سطح ۰ (دستی): هوش مصنوعی هیچ کمکی نمی‌کند. انسان‌ها همه کارها را انجام می‌دهند. • سطح ۱ (کمکی): هوش مصنوعی زمینه (context) را فراهم می‌کند. انسان‌ها تمام تصمیمات را می‌گیرند. • سطح ۲ (تحت نظارت): هوش مصنوعی اقدامات را پیشنهاد می‌دهد. انسان‌ها باید هر یک را تأیید کنند. • سطح ۳ (مشروط): هوش مصنوعی در چارچوب قوانین تعیین‌شده عمل می‌کند. به انسان‌ها اطلاع‌رسانی می‌شود. • سطح ۴ (خودمختار): هوش مصنوعی به تنهایی عمل و تأیید می‌کند.

هرگز یک اتوماسیون را برای همیشه در سطح ۴ رها نکنید. سیستم‌ها تغییر می‌کنند. اتوماسیونی که امروز کار می‌کند، اگر مسئله اصلی تغییر کند، ممکن است فردا خطرناک شود. شما باید هر اقدام خودمختار را به طور منظم بازبینی کنید.

زمانی که این چهار محرک رخ داد، از اتوماسیون به نظارت انسانی تغییر وضعیت دهید:

اجازه ندهید «هوش مصنوعی تصمیم گرفت» بهانه‌ی شما باشد. هر اقدامی باید به یک انسان یا سیاستی که توسط مدیریت تأیید شده است، بازگردد.

قبل از فعال کردن اتوماسیون، سیاست خود را تدوین کنید. از داده‌ها برای اثبات دقت هوش مصنوعی خود استفاده کنید. اگر هوش مصنوعی شما بیش از حد اشتباه می‌کند، بلافاصله سطح خودمختاری آن را کاهش دهید.

Source: https://dev.to/npayyappilly/the-human-in-the-loop-sre-designing-automation-escalation-policies-for-ai-assisted-operations-2c7f

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi