هوش مصنوعی کد می‌نویسد، اما نمی‌تواند «تمام‌شده» را تعریف کند.

من یک تولیدکننده اسلاید با هوش مصنوعی ساختم. شما یک موضوع را تایپ می‌کنید و یک ارائه دریافت می‌کنید.

دموی هوش مصنوعی بلافاصله کار کرد. یک طرح کلی نوشت. اسلایدها را ساخت. یک فایل خروجی داد. روی صفحه نمایش من، همه چیز تمام‌شده به نظر می‌رسید.

اما تمام‌شده نبود.

هوش مصنوعی ثابت کرد که یک کاربر می‌تواند یک بار، یک مجموعه اسلاید بسازد. اما یک محصول واقعی متفاوت است. محصول باید بتواند همزمان ۱۰۰ کاربر را مدیریت کند. باید هزینه‌ها را به درستی محاسبه کند. باید در صورت شکست یک مرحله، خود را بازیابی کند. و باید فایلی خروجی دهد که واقعاً در PowerPoint باز شود.

هوش مصنوعی این موارد را اضافه نکرد، چون من به او نگفته بودم.

وقتی با هوش مصنوعی می‌سازید، بخش سخت کار، توصیف ویژگی‌ها نیست؛ بلکه بخش سخت، تعریف کردن معنای «تمام‌شده» است.

من از Velobase Harness برای زیرساخت استفاده کردم. این ابزار احراز هویت، پرداخت‌ها، اعتبارها و پایگاه‌های داده را مدیریت می‌کرد. این کار به من اجازه داد تا تمرکز هوش مصنوعی را روی خودِ فرآیند تولید PPT قرار دهم.

اینجاست که «تمام‌شده به نظر رسیدن» و «واقعاً تمام‌شده بودن» از هم جدا شدند. من چهار شکاف اصلی پیدا کردم:

  • همزمانی (Concurrency): هوش مصنوعی فکر می‌کند یک اجرای موفق به معنای یک ویژگی تمام‌شده است. یک سیستم واقعی نیاز دارد که وظایف را به صف‌ها (queues) تقسیم کند. شما باید هر اسلاید را به عنوان یک وظیفه مجزا تولید کنید تا کارگران (workers) بتوانند مقیاس‌پذیر عمل کنند.

  • صورت‌حساب (Billing): هوش مصنوعی اعتبار را یک بار کسر می‌کند و تمام. یک محصول واقعی به یک ماشین حالت (state machine) نیاز دارد. شما باید اعتبار را رزرو کنید، بر اساس استفاده واقعی تسویه کنید و در صورت شکست، آن را مسترد کنید.

  • خودبازبینی (Self-review): اگر بک‌اند یک وظیفه را بی‌صدا دوباره تلاش کند، کاربر فقط یک آیکون در حال چرخش می‌بیند. شما باید وضعیت را نشان دهید. کاربر باید عباراتی مثل «در حال بررسی» یا «در حال بازطراحی» را ببیند تا بداند سیستم در حال کار است.

  • خروجی (Export): یک اسلاید ممکن است در مرورگر عالی به نظر برسد اما در یک فایل PPTX خراب شود. نیاز اصلی فقط ساختن یک فایل نیست؛ بلکه این است که فایل حتماً با پیش‌نمایش وب مطابقت داشته باشد.

من دستورالعمل‌هایم را تغییر دادم. دیگر به هوش مصنوعی لیست ویژگی‌ها نمی‌دادم، بلکه شروع کردم به دادن معیارهای پذیرش (acceptance criteria).

قوانین جدید من برای هوش مصنوعی:

  • یک SaaS آماده‌ی تولید بساز، نه یک دمو.
  • از ۱۰۰ کاربر همزمان پشتیبانی کن.
  • از صف‌های مستقل برای برنامه‌ریزی و ساخت اسلاید استفاده کن.
  • هر فراخوانی مدل را به سیستم صورت‌حساب متصل کن.
  • وظایف را بر اساس موجودی اعتبار، متوقف و از سر گرفته کن.
  • بعد از هر اسلاید، بررسی چیدمان (layout) را انجام بده.
  • اطمینان حاصل کن که خروجی PPTX با پیش‌نمایش بصری مطابقت دارد.
  • تست‌هایی برای همزمانی و شکست بنویس، نه فقط برای موفقیت.

هوش مصنوعی سریع کد می‌نویسد. اما نمی‌داند چه چیزی باعث می‌شود یک کد قابل عرضه (shippable) باشد. او یک دموی محلی را به عنوان یک سیستم کامل در نظر می‌گیرد.

نقش انسان، تعیین مرزهای مهندسی، موارد شکست و قوانین کسب‌وکار است.

Harness زیرساخت SaaS را فراهم می‌کند. هوش مصنوعی منطق را تکمیل می‌کند. شما فقط باید دقیق‌ترین ورودی‌ها را ارائه دهید.

اگر محصولی را که توسط هوش مصنوعی ساخته شده عرضه کرده‌اید، سخت‌ترین شکاف میان «کار می‌کند» و «برای مشتریان آماده است» چه بود؟

منبع: https://dev.to/velobasex/ai-can-write-the-code-it-cant-tell-you-when-the-product-is-done-4oh6