𝗧𝗵𝗲 𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗦𝗥𝗘

📅4 hours ago⏱1 min read

Der Human-in-the-Loop SRE

Automatisierung ist schneller als Menschen.

Im Jahr 2021 verursachte eine Konfigurationsänderung bei Fastly einen weltweiten Ausfall. Die Automatisierung verbreitete den Fehler in weniger als einer Minute. Es dauerte 49 Minuten, bis Menschen ihn behoben hatten.

Dies ist die Kernherausforderung von KI-gestütztem SRE. KI kann Probleme mit Geschwindigkeiten erkennen und beheben, die Menschen nicht erreichen können. Die Gefahr ist nicht die Technologie. Die Gefahr ist die Geschwindigkeitslücke zwischen automatisierten Aktionen und menschlicher Verantwortlichkeit.

Sie müssen eine Eskalationsrichtlinie entwerfen, um festzulegen, wo die Automatisierung endet und das menschliche Urteilsvermögen beginnt.

Nutzen Sie das Automation Autonomy Spectrum, um Ihre KI zu steuern:

• Level 0 (Manuell): Die KI bietet keine Hilfe. Menschen erledigen alles. • Level 1 (Unterstützt): Die KI liefert Kontext. Menschen treffen alle Entscheidungen. • Level 2 (Überwacht): Die KI schlägt Aktionen vor. Menschen müssen jede einzelne genehmigen. • Level 3 (Bedingt): Die KI handelt innerhalb festgelegter Regeln. Menschen werden benachrichtigt. • Level 4 (Autonom): Die KI handelt und verifiziert allein.

Lassen Sie eine Automatisierung niemals dauerhaft auf Level 4. Systeme ändern sich. Eine Automatisierung, die heute funktioniert, kann morgen gefährlich werden, wenn sich das zugrunde liegende Problem verschiebt. Sie müssen jede autonome Aktion regelmäßig überprüfen.

Wechseln Sie von der Automatisierung zur menschlichen Aufsicht, wenn diese vier Auslöser auftreten:

Geringe Konfidenz (Low Confidence): Die KI ist sich ihrer Diagnose nicht sicher.
Großer Schadensradius (High Blast Radius): Die Aktion betrifft zu viele Dienste oder Benutzer.
Neuartigkeit (Novelty): Das Fehlermuster ist neu und der KI bisher unbekannt.
Regulierung (Regulation): Die Aktion betrifft ein geschütztes oder regelkonformes System.

Lassen Sie „die KI hat entschieden“ nicht zu Ihrer Entschuldigung werden. Jede Aktion muss auf einen Menschen oder eine von der Führungsebene genehmigte Richtlinie zurückführbar sein.

Erstellen Sie Ihre Richtlinie, bevor Sie die Automatisierung aktivieren. Nutzen Sie Daten, um zu beweisen, dass Ihre KI präzise arbeitet. Wenn Ihre KI zu oft falsch liegt, stufen Sie ihre Autonomie sofort herab.

Quelle: https://dev.to/npayyappilly/the-human-in-the-loop-sre-designing-automation-escalation-policies-for-ai-assisted-operations-2c7f

Optionale Lern-Community: https://t.me/GyaanSetuAi

𝗧𝗵𝗲 𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗦𝗥𝗘

Continue reading

𝗛𝗼𝘄 𝗔𝗜 𝗖𝗵𝗮𝗻𝗴𝗲𝘀 𝗦𝗥𝗘 𝗪𝗼𝗿𝗸𝗳𝗹𝗼𝘄𝘀

𝗧𝗵𝗲 𝗜𝗻𝗳𝗿𝗮𝘀𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲 𝗥𝘂𝗹𝗲 𝗙𝗼𝗿 𝗦𝗮𝗳𝗲 𝗔𝗜

𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗶𝗻 𝗔𝗜: 𝗠𝗼𝗻𝗶𝘁𝗼𝗿𝗶𝗻𝗴 𝗶𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵

𝗧𝗵𝗲 𝗨𝗻𝘀𝗲𝗲𝗻 𝗖𝗼𝗻𝘀𝗲𝗾𝘂𝗲𝗻𝗰𝗲𝘀 𝗼𝗳 𝗔𝗜

𝗛𝗼𝘄 𝘁𝗼 𝗘𝘃𝗮𝗹𝘂𝗮𝘁𝗲 𝗔𝗜 𝗦𝗥𝗘 𝗧𝗼𝗼𝗹𝘀