عامل دقیقاً همان کاری را انجام داد که از او خواستم و مشکل همین بود

عامل‌های کدنویسی هوش مصنوعی در سال ۲۰۲۴ همه چیز را تغییر دادند.

آن‌ها کدبیس شما را می‌خوانند. از الگوهای نام‌گذاری شما پیروی می‌کنند. دامنه کاری شما را درک می‌کنند.

فکر کردم این یعنی یک کار دو هفته‌ای، دو روز طول خواهد کشید. اشتباه می‌کردم.

من یک وظیفه بزرگ به یک عامل دادم: ساخت یک مکانیزم رویداد سراسری برای یک اپلیکیشن React Native. من یک برنامه ریزی کردم. برنامه را تأیید کردم.

عامل دقیقاً طبق برنامه پیش رفت. مشکل همین بود.

برنامه جزئیات حیاتی را نادیده گرفته بود. تأثیری بر کامپوننت‌هایی که به صورت شرطی بارگذاری می‌شوند، نداشت. تأثیر آن بر کل سیستم را نیز ترسیم نکرده بود.

عامل مشکلات قابل مشاهده را حل کرد، اما مشکلات نامرئی را از خود به جای گذاشت.

اتفاقی که افتاد این بود:

• رابط کاربری (UI) در بخش‌هایی که برنامه نادیده گرفته بود، از کار افتاد. • عامل، هندلرهای رویداد (event handlers) تکراری اضافه کرد. • عامل، الگوهای جدیدی با استفاده از Context و Redux ابداع کرد که من از او نخواسته بودم.

عامل به دلیل کد بد شکست نخورد. بلکه به دلیل نبود محدودیت‌ها شکست خورد.

وقتی قانونی تعیین نمی‌کنید، هوش مصنوعی حدس می‌زند. حدس او اغلب اشتباه است.

سعی کردم از طریق چت آن را اصلاح کنم. کد روی کد اضافه کردم. رشته گفتگو (chat thread) خیلی طولانی شد. چت‌های جدیدی شروع کردم. این چرخه تکرار شد.

تا روز سوم، کد ۷۵٪ انجام شده بود اما شکننده بود. هیچ سندی از اینکه چه چیزی کار کرد یا چه چیزی شکست خورد وجود نداشت.

متوجه شدم مشکل از ابزار نبود، بلکه از نقش بود.

هوش مصنوعی می‌تواند کد بنویسد، اما نمی‌تواند تصمیم بگیرد که ماهیت واقعی کار چیست.

بازبینی انسانی خطاها را پس از وقوع شناسایی می‌کند. اما قضاوت انسانی باید پیش از شروع کار، ماهیت آن را تعریف کند.

شما به ابزار بهتری نیاز ندارید. شما به یک قرارداد نیاز دارید.

من یک گردش کار (workflow) هفت مرحله‌ای ساختم. یک انسان باید هر مرحله از تحویل کار (handoff) را پیش از شروع مرحله بعد تأیید کند. این کار تضمین می‌کند که کار در چارچوب‌های تعریف‌شده باقی بماند.

Source: https://dev.to/jeelvankhede/the-agent-did-exactly-what-i-asked-and-that-was-the-problem-1hek

Optional learning community: https://t.me/GyaanSetuAi