AI כותב קוד, אבל הוא לא יודע מתי מוצר באמת מוכן
בניתי מחולל מצגות מבוסס AI באמצעות Velobase Harness.
אתם מקלידים נושא ומקבלים מצגת. ה-AI כתב ראשי פרקים, יצר את השקופיות וייצא קובץ. בדמו, זה נראה מוכן.
זה לא היה מוכן.
הדמו הוכיח רק שמשתמש אחד יכול ליצור מצגת אחת פעם אחת. מוצר אמיתי הוא שונה. הוא חייב לתמוך ב-100 אנשים בו-זמנית. הוא חייב לחייב משתמשים בצורה נכונה. הוא חייב להתאושש כששלב מסוים נכשל. הוא חייב לייצא קובץ PPTX שעובד באמת ב-PowerPoint.
ה-AI לא הוסיף את הדברים האלה כי לא אמרתי לו לעשות זאת.
כשבונים עם AI, החלק הקשה הוא לא לתאר את הפיצ'ר. החלק הקשה הוא להגדיר מה המשמעות של "מוכן".
השתמשתי ב-Velobase Harness עבור החלקים המשעממים:
- אימות (Auth) ותשלומים
- קרדיטים וניהול (admin)
- בסיסי נתונים ותורים (queues)
- אחסון אובייקטים ופריסה (deployment)
זה אפשר לי למקד את ה-AI בחלק היחיד שהיה שייך לי: יצירת ה-PPT.
הנה ארבע דרכים שבהן "נראה מוכן" ו"מוכן באמת" שונות:
מקביליות (Concurrency) ה-AI חושב שאם זה עובד פעם אחת, זה הושלם. אבל 100 משתמשים זקוקים לצינור עיבוד (pipeline). עליך לפצל משימות לתורים של תכנון (plan), שקופיות (slide) וסיום (finalize). עליך ליצור כל שקופית כמשימה נפרדת כדי שהעובדים (workers) יוכלו להתרחב (scale).
חיוב (Billing) מוצר אמיתי זקוק למכונת מצבים (state machine). עליך לשמור קרדיטים מראש. עליך לבצע התחשבנות על סמך מה שהוצא בפועל. עליך לבצע החזר (refund) במקרה של כישלון ולהשהות את הפעולה כשהיתרה נגמרת.
בדיקה עצמית (Self-review) אם מערכת מנסה לבצע משימה שוב בשקט, המשתמש רואה רק סמל טעינה (spinner). כדי להפוך את זה לפיצ'ר, עליך להציג את ההתקדמות. הראה למשתמש מתי המערכת "מייצרת" (generating), "בודקת" (checking) או "מציירת מחדש" (redrawing).
ייצוא (Export) שקופית עשויה להיראות מושלמת בדפדפן אך להישבר בקובץ PPTX. הדרישה שלך חייבת להיות: הייצוא חייב להתאים לתצוגה המקדימה בדפדפן.
השיעור הוא פשוט. AI טוב בכתיבת קוד. הוא לא יודע מה הופך מוצר למוכן להפצה (shippable). הוא מתייחס לדמו מקומי כמערכת שלמה.
עליך לספק את הגבולות ההנדסיים ואת מקרי הכישלון. הפצה מהירה יותר מגיעה מקלט חד ומדויק יותר, לא מפחות מחשיבה.
אם בניתם משהו עם AI, מה היה הפער הקשה ביותר בין דמו למוצר אמיתי?
Source: https://dev.to/velobasex/ai-can-write-the-code-it-cant-tell-you-when-the-product-is-done-4oh6
Optional learning community: https://t.me/GyaanSetuAi