تحلیل پس از حادثه بدون مقصر که همچنان شما را مقصر می‌داند

در یک جلسه نشسته‌اید. اسلاید می‌گوید این یک تحلیل پس از حادثه بدون مقصر است. تسهیل‌گر به شما می‌گوید به جای افراد، روی سیستم‌ها تمرکز کنید. سر تکان می‌دهید. اما همچنان احساس می‌کنید که در حال ثبت تخلف برای شما هستند.

شرکت‌ها از ادبیات «امنیت روانی» استفاده می‌کنند. هیچ‌کس نمی‌پرسد چه کسی سیستم را خراب کرده است؛ بلکه می‌پرسند چه چیزی اجازه داد این شکست رخ دهد. این خوب به نظر می‌رسد. اما برای بسیاری از مهندسان، تحلیل‌های پس از حادثه به ابزارهای نظارتی تبدیل شده‌اند.

ماجرا از این قرار است:

یک خط زمانی از حادثه در یک پوشه مشترک قرار می‌گیرد. سوالی در یک رشته گفتگو ظاهر می‌شود: «آیا قبل از ارتقای سطح (escalation)، هشدار مشاهده شده بود؟» این سوال واقعی به نظر می‌رسد. اما در واقعیت، این یک برچسب زمانی است که نام شما روی آن نوشته شده است. مدیر شما هنگام نوشتن ارزیابی عملکرد شما، این را می‌بیند. سیستم انگشت اتهام را به سمت کسی نمی‌گیرد؛ فقط ثبت می‌کند چه کسی، چه چیزی را و در چه زمانی لمس کرده است.

تیم‌ها معتقدند تحلیل‌های دقیق پس از حادثه از بروز اشتباهات جلوگیری می‌کنند. برای دقیق بودن، آن‌ها همه چیز را ردیابی می‌کنند. آن‌ها ثبت می‌کنند که چه کسی کد را ادغام (merge) کرده و چه کسی بازگشت به عقب (rollback) را تأیید کرده است. این داده‌ها به یک ردپای کاغذی تبدیل می‌شوند. در فصل ارزیابی‌ها، حضور داشتن «در خط زمانی حادثه» مانند الگویی از شکست به نظر می‌رسد. فرقی نمی‌کند که شما کسی بوده‌اید که باگ را رفع کرده‌اید؛ شما در نزدیکی حادثه بوده‌اید و این الگو برای شما هزینه خواهد داشت.

مهندسان باهوش برای بقا شروع به بازی کردن می‌کنند.

  • آن‌ها از اینکه آخرین نفر برای تغییر یک تنظیمات (config) باشند، اجتناب می‌کنند.
  • آن‌ها قبل از جلسه، از نقش‌های مربوط به مدیریت حادثه فاصله می‌گیرند.
  • آن‌ها موارد اقدام (action items) را مبهم می‌نویسند تا هیچ فرد مشخصی مسئولیت آن‌ها را بر عهده نگیرد.

این تنبلی نیست؛ این بقاست. وقتی فرهنگ بدون مقصر یک دروغ باشد، افراد دیگر برای شیفت‌های آماده‌باش (on-call) داوطلب نمی‌شوند. آن‌ها دیگر مسئولیت رفع مشکل را نمی‌پذیرند. آن‌ها بیشتر از آنکه به سیستم اهمیت دهند، نگران ردپای کاغذی خود هستند.

حقیقت را زمانی می‌بینید که یک مهندس ارشد درخواست می‌کند دیگر در شیفت آماده‌باش نباشد. مدیریت آن را مشکل انگیزشی می‌نامد، اما در واقع این یک مشکل اعتماد است. حقیقت را زمانی می‌بینید که موارد اقدام به جای اتوماسیون، بر «مربی‌گری» (coaching) تمرکز می‌کنند. مربی‌گری چیزی نیست جز یک ارزیابی عملکرد در لباس مبدل.

یک فرهنگ واقعیِ بدون مقصر، مستلزم آن است که سازمان از استفاده از گزارش‌های حادثه به عنوان سوابق رزومه خودداری کند.

  • تحلیل‌های پس از حادثه باید از فردی که پنج بار برای کمک حاضر شده است، قدردانی کنند.
  • موارد اقدام باید بر اتوماسیون و قطع‌کننده‌ها (circuit breakers) تمرکز کنند.
  • اصلاحات باید سیستم را بهبود بخشند، نه فرد را.

تا آن زمان، «بدون مقصر» فقط کلمه‌ای است که پیش از بخش دردناک ماجرا به کار می‌رود.

منبع: https://dev.to/omieee_24/the-blameless-postmortem-that-still-blames-you-3bdc

جامعه یادگیری اختیاری: https://t.me/GyaanSetuAi