𝗠𝘆 𝗖𝗼𝗱𝗶𝗻𝗴 𝗔𝗴𝗲𝗻𝘁 𝗔𝘀𝗸𝗲𝗱 𝗣𝗲𝗿𝗺𝗶𝘀𝘀𝗶𝗼𝗻 𝗳𝗼𝗿 𝗘𝘃𝗲𝗿𝘆 𝗧𝗶𝗻𝘆 𝗦𝘁𝗲𝗽

📅2 hours ago⏱2 min read

𝗠𝗼́𝗷 𝗔𝗴𝗲𝗻𝘁 𝗣𝗿𝗼𝗴𝗿𝗮𝗺𝗶𝘀𝘁𝘆𝗰𝘇𝗻𝘆 𝗣𝗿𝗼𝘀𝗶ł 𝗼 𝗣𝗼𝘇𝘄𝗼𝗹𝗲𝗻𝗶𝗲 𝗻𝗮 𝗞𝗮ż𝗱𝘆 𝗡𝗮𝗷𝗺𝗶𝗲𝗻𝘀𝘇𝘆 𝗞𝗿𝗼𝗸

Mój asystent AI miał poważny problem. Nie polegał na tym, że odmawiał proszenia o pozwolenie. Prosił o nie po prostu zbyt często.

Zadawałem mu proste zadania, jak np. odczytanie pliku PDF. Asystent wykonywał jeden ruch, prosił o zatwierdzenie, uruchamiał polecenie, a następnie natychmiast prosił ponownie o kolejny, drobny krok. Jedno zadanie zamieniało się w niekończącą się serię komunikatów.

Komunikaty o zatwierdzenie są niezbędne. Chcesz, aby lokalny asystent zatrzymał się przed uruchomieniem poleceń, zapisaniem plików lub otwarciem aplikacji. Jednak prawdziwa praca wymaga wielu kroków. Odczytanie PDF-a obejmuje sprawdzenie obecności Pythona, znalezienie konwertera, uruchomienie tego konwertera i odczytanie tekstu.

Jeśli każdy pojedynczy krok wymaga zatwierdzenia, przestajesz oceniać ryzyko. Zaczynasz klikać przez przerwy tylko po to, aby zniknęły. To uczy Cię ignorowania systemu bezpieczeństwa. Jest to bardziej niebezpieczne niż brak jakiegokolwiek zabezpieczenia.

Stary przepływ pracy wyglądał następująco:

Asystent wybiera narzędzie
Polityka wymaga potwierdzenia
Użytkownik zatwierdza
Narzędzie zostaje uruchomione
Asystent ponownie prosi o kolejne narzędzie

Asystent nie zrozumiał intencji użytkownika. Nie zatwierdzałeś jednego małego testu. Zatwierdzałeś całe zadanie.

Zmieniłem sposób działania CliGate. Teraz, gdy zatwierdzisz pierwszą akcję na czacie, system ustawia flagę. Pozwala to na kontynuowanie późniejszych kroków bez kolejnych rund zatwierdzania. Asystent nadal otrzymuje rzeczywiste wyniki, dzięki czemu może kontynuować pracę.

Dodałem również „wyjście awaryjne”: /safe. Ta komenda włącza ponownie tryb jawnego potwierdzania.

Naprawiłem również błąd językowy. Gdy system kontynuował zadanie, czasami zmieniał język komunikatów. Jeśli mówiłeś po chińsku, asystent przełączał się na angielski przy kolejnym komunikacie. Teraz asystent sprawdza Twoją ostatnią prawdziwą wiadomość, aby wybrać odpowiedni język.

Rozwiązaniem nie jest wyłączenie zatwierdzeń. Rozwiązaniem jest pamiętanie o tym, dlaczego użytkownik udzielił zgody.

Dla narzędzi lokalnych stosuj zaufanie w zakresie zadania:

Pytaj przed przekroczeniem istotnej granicy
Pamiętaj o zatwierdzeniu dla bieżącego zadania
Zapewnij sposób powrotu do trybu rygorystycznego
Nie pozwól, aby komunikaty systemowe zmieniały intencję użytkownika

Tak buduję mechanizmy zatwierdzania w CliGate. Jest to mój lokalny control plane dla Claude Code, Codex CLI i Gemini CLI.

Jak radzicie sobie ze zmęczeniem prośbami o zatwierdzenie? Zatwierdzacie każde wywołanie narzędzia, każde zadanie czy całą sesję?

Source: https://dev.to/codekingai/my-coding-agent-asked-permission-for-every-tiny-step-4a07

𝗠𝘆 𝗖𝗼𝗱𝗶𝗻𝗴 𝗔𝗴𝗲𝗻𝘁 𝗔𝘀𝗸𝗲𝗱 𝗣𝗲𝗿𝗺𝗶𝘀𝘀𝗶𝗼𝗻 𝗳𝗼𝗿 𝗘𝘃𝗲𝗿𝘆 𝗧𝗶𝗻𝘆 𝗦𝘁𝗲𝗽

Continue reading

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗬𝗼𝘂𝗿 𝗙𝗶𝗿𝘀𝘁 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿 𝗔𝗴𝗲𝗻𝘁

𝗠𝗮𝗸𝗲 𝗬𝗼𝘂𝗿 𝗖𝗼𝗱𝗲𝗯𝗮𝘀𝗲 𝗪𝗼𝗿𝗸 𝗙𝗼𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗧𝗵𝗲 𝗣𝗼𝘄𝗲𝗿 𝗼𝗳 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲

𝗕𝗲𝘁𝘁𝗲𝗿 𝗔𝗜 𝗖𝗼𝗱𝗲 𝗦𝗻𝗶𝗽𝗽𝗲𝘁𝘀

𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗚𝗼𝘃𝗲𝗿𝗻𝗮𝗻𝗰𝗲 𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸