تحلیل پس از حادثه بدون مقصر که همچنان شما را مقصر میداند
در یک جلسه نشستهاید. اسلاید میگوید این یک تحلیل پس از حادثه بدون مقصر است. تسهیلگر به شما میگوید به جای افراد، روی سیستمها تمرکز کنید. سر تکان میدهید. اما همچنان احساس میکنید که در حال ثبت تخلف برای شما هستند.
شرکتها از ادبیات «امنیت روانی» استفاده میکنند. هیچکس نمیپرسد چه کسی سیستم را خراب کرده است؛ بلکه میپرسند چه چیزی اجازه داد این شکست رخ دهد. این خوب به نظر میرسد. اما برای بسیاری از مهندسان، تحلیلهای پس از حادثه به ابزارهای نظارتی تبدیل شدهاند.
ماجرا از این قرار است:
یک خط زمانی از حادثه در یک پوشه مشترک قرار میگیرد. سوالی در یک رشته گفتگو ظاهر میشود: «آیا قبل از ارتقای سطح (escalation)، هشدار مشاهده شده بود؟» این سوال واقعی به نظر میرسد. اما در واقعیت، این یک برچسب زمانی است که نام شما روی آن نوشته شده است. مدیر شما هنگام نوشتن ارزیابی عملکرد شما، این را میبیند. سیستم انگشت اتهام را به سمت کسی نمیگیرد؛ فقط ثبت میکند چه کسی، چه چیزی را و در چه زمانی لمس کرده است.
تیمها معتقدند تحلیلهای دقیق پس از حادثه از بروز اشتباهات جلوگیری میکنند. برای دقیق بودن، آنها همه چیز را ردیابی میکنند. آنها ثبت میکنند که چه کسی کد را ادغام (merge) کرده و چه کسی بازگشت به عقب (rollback) را تأیید کرده است. این دادهها به یک ردپای کاغذی تبدیل میشوند. در فصل ارزیابیها، حضور داشتن «در خط زمانی حادثه» مانند الگویی از شکست به نظر میرسد. فرقی نمیکند که شما کسی بودهاید که باگ را رفع کردهاید؛ شما در نزدیکی حادثه بودهاید و این الگو برای شما هزینه خواهد داشت.
مهندسان باهوش برای بقا شروع به بازی کردن میکنند.
- آنها از اینکه آخرین نفر برای تغییر یک تنظیمات (config) باشند، اجتناب میکنند.
- آنها قبل از جلسه، از نقشهای مربوط به مدیریت حادثه فاصله میگیرند.
- آنها موارد اقدام (action items) را مبهم مینویسند تا هیچ فرد مشخصی مسئولیت آنها را بر عهده نگیرد.
این تنبلی نیست؛ این بقاست. وقتی فرهنگ بدون مقصر یک دروغ باشد، افراد دیگر برای شیفتهای آمادهباش (on-call) داوطلب نمیشوند. آنها دیگر مسئولیت رفع مشکل را نمیپذیرند. آنها بیشتر از آنکه به سیستم اهمیت دهند، نگران ردپای کاغذی خود هستند.
حقیقت را زمانی میبینید که یک مهندس ارشد درخواست میکند دیگر در شیفت آمادهباش نباشد. مدیریت آن را مشکل انگیزشی مینامد، اما در واقع این یک مشکل اعتماد است. حقیقت را زمانی میبینید که موارد اقدام به جای اتوماسیون، بر «مربیگری» (coaching) تمرکز میکنند. مربیگری چیزی نیست جز یک ارزیابی عملکرد در لباس مبدل.
یک فرهنگ واقعیِ بدون مقصر، مستلزم آن است که سازمان از استفاده از گزارشهای حادثه به عنوان سوابق رزومه خودداری کند.
- تحلیلهای پس از حادثه باید از فردی که پنج بار برای کمک حاضر شده است، قدردانی کنند.
- موارد اقدام باید بر اتوماسیون و قطعکنندهها (circuit breakers) تمرکز کنند.
- اصلاحات باید سیستم را بهبود بخشند، نه فرد را.
تا آن زمان، «بدون مقصر» فقط کلمهای است که پیش از بخش دردناک ماجرا به کار میرود.
منبع: https://dev.to/omieee_24/the-blameless-postmortem-that-still-blames-you-3bdc
جامعه یادگیری اختیاری: https://t.me/GyaanSetuAi