Your Agent Demo Works. That's The Trap.

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialלפני שבועיים2min read

הדמו של הסוכן שלך עובד. זו המלכודת.

אני בונה סוכני AI עבור חברות. אני רואה את אותו דפוס לעיתים קרובות. המודל עובד בדמו. אתם משחררים את המוצר. ואז הוא נכשל פעם אחת מכל שלוש פעמים בייצור (production). אף אחד לא יודע למה.

הפער בין דמו לייצור הוא מתמטיקה. ברגע שמבינים את המתמטיקה, בונים אחרת.

אם כל שלב בסוכן שלכם הוא אמין ב-95%, זה נשמע טוב. אבל סוכנים משתמשים בשרשראות של שלבים. אם מחברים עשר שרשראות שלבים, שיעור ההצלחה שלכם צונח ל-60%. אם משתמשים בעשרים שלבים, שיעור ההצלחה צונח ל-36%.

בעבודה אמיתית, לשלבים יש לעיתים קרובות שיעורי שגיאה של 10% עד 20%. אם לסוכן יש שמונה שלבים עם אמינות של 85%, הוא נכשל ב-75% מהזמן.

המודל הוא לא הבעיה. הסבירות המצטברת (compounding probability) היא הבעיה.

דמו מציג "נתיב אושר" (happy path) יחיד. הוא משתמש בקלט נקי ובשרשראות קצרות. הייצור משתמש בנתונים מבולגנים ממאות משתמשים. הוא משתמש בשרשראות ארוכות הכוללות שלבים נסתרים.

כשל בסוכנים לא נראה כמו קריסה. הוא נראה כמו שגיאה שקטה.

שלב 3 קורא שדה בצורה שגויה. הפלט עדיין נראה כמו

Your Agent Demo Works. That's The Trap.

Continue reading

סוכן ה-AI שלך עבר את כל הבדיקות — ואז נכשל בסביבת הייצור

𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗴𝗲𝗻𝘁 𝗟𝗼𝗼𝗽

𝗬𝗼𝘂𝗿 𝗔𝗴𝗲𝗻𝘁 𝗗𝗲𝗺𝗼 𝗪𝗼𝗿𝗸𝘀. 𝗬𝗼𝘂𝗿 𝗔𝗴𝗲𝗻𝘁 𝗗𝗼𝗲𝘀𝗻'𝘁.

The Exact Stack I Use to Build Production AI Agents