هوش مصنوعی کد مینویسد، اما نمیتواند «تمامشده» را تعریف کند.
من یک تولیدکننده اسلاید با هوش مصنوعی ساختم. شما یک موضوع را تایپ میکنید و یک ارائه دریافت میکنید.
دموی هوش مصنوعی بلافاصله کار کرد. یک طرح کلی نوشت. اسلایدها را ساخت. یک فایل خروجی داد. روی صفحه نمایش من، همه چیز تمامشده به نظر میرسید.
اما تمامشده نبود.
هوش مصنوعی ثابت کرد که یک کاربر میتواند یک بار، یک مجموعه اسلاید بسازد. اما یک محصول واقعی متفاوت است. محصول باید بتواند همزمان ۱۰۰ کاربر را مدیریت کند. باید هزینهها را به درستی محاسبه کند. باید در صورت شکست یک مرحله، خود را بازیابی کند. و باید فایلی خروجی دهد که واقعاً در PowerPoint باز شود.
هوش مصنوعی این موارد را اضافه نکرد، چون من به او نگفته بودم.
وقتی با هوش مصنوعی میسازید، بخش سخت کار، توصیف ویژگیها نیست؛ بلکه بخش سخت، تعریف کردن معنای «تمامشده» است.
من از Velobase Harness برای زیرساخت استفاده کردم. این ابزار احراز هویت، پرداختها، اعتبارها و پایگاههای داده را مدیریت میکرد. این کار به من اجازه داد تا تمرکز هوش مصنوعی را روی خودِ فرآیند تولید PPT قرار دهم.
اینجاست که «تمامشده به نظر رسیدن» و «واقعاً تمامشده بودن» از هم جدا شدند. من چهار شکاف اصلی پیدا کردم:
همزمانی (Concurrency): هوش مصنوعی فکر میکند یک اجرای موفق به معنای یک ویژگی تمامشده است. یک سیستم واقعی نیاز دارد که وظایف را به صفها (queues) تقسیم کند. شما باید هر اسلاید را به عنوان یک وظیفه مجزا تولید کنید تا کارگران (workers) بتوانند مقیاسپذیر عمل کنند.
صورتحساب (Billing): هوش مصنوعی اعتبار را یک بار کسر میکند و تمام. یک محصول واقعی به یک ماشین حالت (state machine) نیاز دارد. شما باید اعتبار را رزرو کنید، بر اساس استفاده واقعی تسویه کنید و در صورت شکست، آن را مسترد کنید.
خودبازبینی (Self-review): اگر بکاند یک وظیفه را بیصدا دوباره تلاش کند، کاربر فقط یک آیکون در حال چرخش میبیند. شما باید وضعیت را نشان دهید. کاربر باید عباراتی مثل «در حال بررسی» یا «در حال بازطراحی» را ببیند تا بداند سیستم در حال کار است.
خروجی (Export): یک اسلاید ممکن است در مرورگر عالی به نظر برسد اما در یک فایل PPTX خراب شود. نیاز اصلی فقط ساختن یک فایل نیست؛ بلکه این است که فایل حتماً با پیشنمایش وب مطابقت داشته باشد.
من دستورالعملهایم را تغییر دادم. دیگر به هوش مصنوعی لیست ویژگیها نمیدادم، بلکه شروع کردم به دادن معیارهای پذیرش (acceptance criteria).
قوانین جدید من برای هوش مصنوعی:
- یک SaaS آمادهی تولید بساز، نه یک دمو.
- از ۱۰۰ کاربر همزمان پشتیبانی کن.
- از صفهای مستقل برای برنامهریزی و ساخت اسلاید استفاده کن.
- هر فراخوانی مدل را به سیستم صورتحساب متصل کن.
- وظایف را بر اساس موجودی اعتبار، متوقف و از سر گرفته کن.
- بعد از هر اسلاید، بررسی چیدمان (layout) را انجام بده.
- اطمینان حاصل کن که خروجی PPTX با پیشنمایش بصری مطابقت دارد.
- تستهایی برای همزمانی و شکست بنویس، نه فقط برای موفقیت.
هوش مصنوعی سریع کد مینویسد. اما نمیداند چه چیزی باعث میشود یک کد قابل عرضه (shippable) باشد. او یک دموی محلی را به عنوان یک سیستم کامل در نظر میگیرد.
نقش انسان، تعیین مرزهای مهندسی، موارد شکست و قوانین کسبوکار است.
Harness زیرساخت SaaS را فراهم میکند. هوش مصنوعی منطق را تکمیل میکند. شما فقط باید دقیقترین ورودیها را ارائه دهید.
اگر محصولی را که توسط هوش مصنوعی ساخته شده عرضه کردهاید، سختترین شکاف میان «کار میکند» و «برای مشتریان آماده است» چه بود؟
منبع: https://dev.to/velobasex/ai-can-write-the-code-it-cant-tell-you-when-the-product-is-done-4oh6