Der Human-in-the-Loop SRE

Automatisierung ist schneller als Menschen.

Im Jahr 2021 verursachte eine Konfigurationsänderung bei Fastly einen weltweiten Ausfall. Die Automatisierung verbreitete den Fehler in weniger als einer Minute. Es dauerte 49 Minuten, bis Menschen ihn behoben hatten.

Dies ist die Kernherausforderung von KI-gestütztem SRE. KI kann Probleme mit Geschwindigkeiten erkennen und beheben, die Menschen nicht erreichen können. Die Gefahr ist nicht die Technologie. Die Gefahr ist die Geschwindigkeitslücke zwischen automatisierten Aktionen und menschlicher Verantwortlichkeit.

Sie müssen eine Eskalationsrichtlinie entwerfen, um festzulegen, wo die Automatisierung endet und das menschliche Urteilsvermögen beginnt.

Nutzen Sie das Automation Autonomy Spectrum, um Ihre KI zu steuern:

• Level 0 (Manuell): Die KI bietet keine Hilfe. Menschen erledigen alles. • Level 1 (Unterstützt): Die KI liefert Kontext. Menschen treffen alle Entscheidungen. • Level 2 (Überwacht): Die KI schlägt Aktionen vor. Menschen müssen jede einzelne genehmigen. • Level 3 (Bedingt): Die KI handelt innerhalb festgelegter Regeln. Menschen werden benachrichtigt. • Level 4 (Autonom): Die KI handelt und verifiziert allein.

Lassen Sie eine Automatisierung niemals dauerhaft auf Level 4. Systeme ändern sich. Eine Automatisierung, die heute funktioniert, kann morgen gefährlich werden, wenn sich das zugrunde liegende Problem verschiebt. Sie müssen jede autonome Aktion regelmäßig überprüfen.

Wechseln Sie von der Automatisierung zur menschlichen Aufsicht, wenn diese vier Auslöser auftreten:

Lassen Sie „die KI hat entschieden“ nicht zu Ihrer Entschuldigung werden. Jede Aktion muss auf einen Menschen oder eine von der Führungsebene genehmigte Richtlinie zurückführbar sein.

Erstellen Sie Ihre Richtlinie, bevor Sie die Automatisierung aktivieren. Nutzen Sie Daten, um zu beweisen, dass Ihre KI präzise arbeitet. Wenn Ihre KI zu oft falsch liegt, stufen Sie ihre Autonomie sofort herab.

Quelle: https://dev.to/npayyappilly/the-human-in-the-loop-sre-designing-automation-escalation-policies-for-ai-assisted-operations-2c7f

Optionale Lern-Community: https://t.me/GyaanSetuAi