AI כותב קוד. הוא לא יכול להגדיר מה זה "סיום".
בניתי מחולל מצגות מבוסס AI. אתה מקליד נושא ומקבל פרזנטציה.
הדמו של ה-AI עבד באופן מיידי. הוא כתב ראשי פרקים. הוא יצר שקופיות. הוא ייצא קובץ. על המסך שלי, זה נראה מוכן.
זה לא היה מוכן.
ה-AI הוכיח שמשתמש אחד יכול ליצור מצגת אחת פעם אחת. מוצר אמיתי הוא שונה. הוא צריך לטפל ב-100 משתמשים בו-זמנית. הוא חייב לחייב אותם בצורה נכונה. הוא חייב להתאושש כששלב מסוים נכשל. הוא חייב לייצא קובץ שבאמת נפתח ב-PowerPoint.
ה-AI לא הוסיף את הדברים האלה כי לא אמרתי לו לעשות זאת.
כשבונים עם AI, החלק הקשה הוא לא לתאר את הפיצ'ר. החלק הקשה הוא להגדיר מה המשמעות של "סיום".
השתמשתי ב-Velobase Harness עבור התשתית. הוא טיפל באימות (auth), תשלומים, קרדיטים ובסיסי נתונים. זה אפשר לי למקד את ה-AI ביצירת ה-PPT עצמה.
שם נוצר הפער בין "נראה מוכן" לבין "מוכן באמת". מצאתי ארבעה פערים עיקריים:
Concurrency: ה-AI חושב שריצה מוצלחת אחת שווה לפיצ'ר מוכן. מערכת אמיתית צריכה לפצל משימות לתורים (queues). עליך ליצור כל שקופית כמשימה נפרדת כדי ש-workers יוכלו להתרחב (scale).
Billing: ה-AI יוריד קרדיטים פעם אחת ויעצור. מוצר אמיתי זקוק למכונת מצבים (state machine). עליך לשמור קרדיטים, לבצע התחשבנות (settle) על בסיס שימוש בפועל, ולהחזיר (refund) במקרה של כישלון.
Self-review: אם ה-backend מנסה שוב משימה בשקט, המשתמש רואה רק אייקון מסתובב. עליך להציג את הסטטוס. המשתמש צריך לראות "בודק" או "מצייר מחדש" כדי לדעת שהמערכת עובדת.
Export: שקופית יכולה להיראות נהדר בדפדפן אבל להישבר בקובץ PPTX. הדרישה היא לא רק ליצור קובץ. הדרישה היא שהקובץ יתאים לתצוגה המקדימה בדפדפן.
שיניתי את ההוראות שלי. הפסקתי לתת ל-AI רשימת פיצ'רים. התחלתי לתת לו קריטריוני קבלה (acceptance criteria).
הכללים החדשים שלי עבור ה-AI:
- לבנות SaaS מוכן לייצור (production-ready), לא דמו.
- לתמוך ב-100 משתמשים בו-זמנית.
- להשתמש בתורים עצמאיים לתכנון וליצירת שקופיות.
- לחבר כל קריאה למודל למערכת החיוב.
- להשהות ולחדש משימות בהתבסס על יתרת קרדיטים.
- להריץ בדיקות פריסה (layout) אחרי כל שקופית.
- לוודא שייצוא ה-PPTX תואם לתצוגה המקדימה הוויזואלית.
- לכתוב טסטים למקביליות ולכישלונות, לא רק להצלחות.
AI כותב קוד מהר. הוא פשוט לא יודע מה הופך קוד לראוי לשחרור (shippable). הוא מתייחס לדמו מקומי כמערכת מלאה.
התפקיד האנושי הוא לספק את גבולות ההנדסה, את מקרי הכשל ואת חוקי הביזנס.
Harness מספקת את תשתית ה-SaaS. ה-AI ממלאת את הלוגיקה. אתם רק צריכים לספק את הקלט המדויק ביותר.
אם שחררתם מוצר שנבנה על ידי AI, מה היה הפער הקשה ביותר בין "זה עובד" לבין "זה מוכן ללקוחות"?
מקור: https://dev.to/velobasex/ai-can-write-the-code-it-cant-tell-you-when-the-product-is-done-4oh6