𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗗𝗲𝘀𝗶𝗴𝗻 𝗳𝗼𝗿 𝗘𝗺𝗮𝗶𝗹 𝗔𝗴𝗲𝗻𝘁𝘀

📅3 hours ago⏱2 min read

Projektowanie modelu Human-in-the-loop dla agentów e-mailowych

Do kolejki wsparcia trafia prośba o zwrot pieniędzy. Twój agent AI znajduje dopasowanie w bazie wiedzy z 91% pewnością. Agent wciąż nie powinien jednak wysyłać tej odpowiedzi.

Większość zespołów postrzega nadzór ludzki jako prosty wybór: albo AI wysyła e-maile samodzielnie, albo człowiek sprawdza wszystko. Oba podejścia zawodzą.

Pełna automatyzacja prowadzi do błędnych odpowiedzi, które szkodzą Twojej marce. Pełna weryfikacja przez człowieka sprawia, że AI staje się drogim generatorem szkiców, który nie oszczędza czasu.

Zamiast przełącznika użyj pokrętła. Ustaw poziom automatyzacji w zależności od typu wiadomości.

Bramka 1: Dopasowanie wiedzy Ta bramka sprawdza, jak pewna jest odpowiedź AI.

• Pewność 85% lub wyższa: Przygotuj szkic odpowiedzi bezpośrednio na podstawie artykułu. • Pewność od 60% do 85%: Przygotuj szkic odpowiedzi, ale dołącz link do źródła, aby człowiek mógł go szybko zweryfikować. • Pewność poniżej 60%: Nie przygotowuj szkicu. Oznacz wiadomość do ręcznej weryfikacji.

Bramka 2: Poziom ryzyka Ta bramka bierze pod uwagę konsekwencje błędu. Ignoruje ona wskaźniki pewności.

• Niskie ryzyko (resetowanie haseł, FAQ): Przygotuj szkic odpowiedzi do zatwierdzenia przez człowieka. • Średnie ryzyko (zwroty, zmiany w rozliczeniach): Przygotuj szkic odpowiedzi, ale wymagaj dodatkowej weryfikacji przez człowieka. • Wysokie ryzyko (groźby prawne, oszustwa): Nie przygotowuj szkicu. Natychmiast przekaż sprawę człowiekowi.

Właśnie dlatego odpowiedź dotycząca zwrotu z 91% pewnością nie zostaje wysłana. Pewność mówi Ci, czy AI zna odpowiedź. Ryzyko mówi Ci, co się stanie, jeśli AI się pomyli. Musisz oddzielić te dwie koncepcje.

Zasada jest prosta: Zawsze pokazuj szkic przed wysłaniem. Nigdy nie używaj automatycznej wysyłki.

Nadzór ludzki to nie podatek. To sposób na zbieranie danych potrzebnych do większej automatyzacji w przyszłości. Aby przejść od modelu „szkic i zatwierdź” do pełnej automatyzacji, używaj logów, aby udowodnić swoją dokładność. Nie polegaj na przeczuciach.

Przypisz typy swoich wiadomości do tych trzech poziomów ryzyka jeszcze w tym tygodniu. Zdecyduj, gdzie nadmiernie weryfikujesz, a gdzie podejmujesz zbyt duże ryzyko.

Źródło: https://dev.to/qasim157/human-in-the-loop-design-for-email-agents-3fhc

Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi

𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗗𝗲𝘀𝗶𝗴𝗻 𝗳𝗼𝗿 𝗘𝗺𝗮𝗶𝗹 𝗔𝗴𝗲𝗻𝘁𝘀

Continue reading

𝗧𝗵𝗲 𝗕𝗹𝗶𝗻𝗱 𝗦𝗽𝗼𝘁 𝗢𝗳 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗜𝗻𝗰𝗶𝗱𝗲𝗻𝘁 𝗥𝗲𝘀𝗽𝗼𝗻𝘀𝗲: 𝗥𝗼𝗹𝗹 𝗕𝗮𝗰𝗸 𝗥𝗼𝗴𝘂𝗲 𝗔𝗴𝗲𝗻𝘁𝘀

𝗧𝗵𝗲 𝗛𝘂𝗺𝗮𝗻 𝗶𝗻 𝘁𝗵𝗲 𝗟𝗼𝗼𝗽 𝗦𝗥𝗘

𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗚𝗼𝘃𝗲𝗿𝗻𝗮𝗻𝗰𝗲 𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸

𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗳𝗼𝗿 𝗘𝗺𝗮𝗶𝗹 𝗔𝗴𝗲𝗻𝘁𝘀