למה הפסקתי להסתמך על ספק AI אחד

📅4 hours ago⏱2 min read

למה הפסקתי להסתמך על ספק AI אחד

בניתי צ'אטבוט בזמן אמת עבור פורום קהילתי. השתמשתי רק ב-OpenAI API. זה נראה פשוט.

שלושה שבועות לאחר מכן, נתקלתי בשגיאת 5xx בשעות השיא. הצ'אטבוט שלי הפסיק לעבוד. המשתמשים כעסו. הבנתי שאני לא יכול לסמוך על ספק אחד עבור אפליקציות פרודקשן (production).

נתקלתי בכמה בעיות עם ספק יחיד:

מגבלות קצב (Rate limits)
פקיעת זמן (Timeouts)
השבתות מלאות

ניסיתי ספקים אחרים, אך לכולם היו פורמטים ושיטות אימות שונות. הקוד שלי הפך לבלגן של הצהרות switch-case.

הייתי צריך מערכת שתוכל:

להפוך ספקים שונים לסטנדרטיים
לבצע ניסיונות חוזרים (Retry) באופן אוטומטי כשספק אחד נכשל
לשמור תגובות במטמון (Cache)
להימנע מנעילת ספק (Vendor lock-in)

נמנעתי מספריות צד-שלישי כי הן היו נוקשות מדי. במקום זאת, בניתי מערכת fallback מותאמת אישית באמצעות עיצוב פשוט.

ראשית, יצרתי ממשק (interface) משותף לכל הספקים. זה מאפשר לכל מודל AI לעבוד עם אותו קוד.

לאחר מכן, בניתי מחלקת router. מחלקה זו מנסה ספקים לפי סדר מסוים. היא משתמשת ב-exponential backoff ובמטמון (caching) פשוט כדי לנהל כשלים.

הנה הלוגיקה:

הגדרת מחלקת בסיס מופשטת (abstract base class) עבור ספקי AI.
מימוש מחלקות ספציפיות עבור OpenAI וספקים אחרים.
שימוש ב-router כדי לעבור בלולאה על רשימת הספקים שלך.
אם ספק נכשל, ה-router ממתין ומנסה את הבא בתור.

המערכת הזו הצילה את הפרויקט שלי במהלך שלוש השבתות אחרונות. היא נשארת שקופה ופשוטה.

אם אתם בונים עם AI, זכרו את הנקודות הבאות:

השתמשו ב-Redis עבור caching בייצור (production) במקום במילון (dictionary) מקומי.
הוסיפו מעקב עלויות כדי לנטר את ההוצאות שלכם.
הטמיעו תמיכה אסינכרונית (asynchronous) לתגובות מהירות יותר.
נתחו (Parse) כותרות "Retry-After" כדי לנהל מגבלות קצב בצורה טובה יותר.

אל תבצעו over-engineering אם הפרויקט שלכם קטן. אבל אם השירות שלכם תלוי בזמינות (uptime), בנו fallback.

איך אתם מטפלים באמינות ספקים בפרויקטים שלכם? האם אתם משתמשים בשכבת fallback או מסתמכים על ספק אחד?

מקור: https://dev.to/__c1b9e06dc90a7e0a676b/why-i-stopped-relying-on-a-single-ai-provider-and-built-a-fallback-system-1pc0

למה הפסקתי להסתמך על ספק AI אחד

Continue reading

𝗧𝗵𝗲 𝗦𝗲𝗰𝗿𝗲𝘁 𝗧𝗼 𝗠𝗮𝗸𝗶𝗻𝗴 𝗠𝗼𝗿𝗲 𝗥𝗲𝗹𝗶𝗮𝗯𝗹𝗲 𝗔𝗜 𝗖𝗵𝗮𝘁𝗯𝗼𝘁𝘀

𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆 𝗶𝗻 𝗔𝗜: 𝗠𝗼𝗻𝗶𝘁𝗼𝗿𝗶𝗻𝗴 𝗶𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵

𝗦𝘁𝗼𝗽 𝗚𝗲𝘁𝘁𝗶𝗻𝗴 𝗕𝗮𝗱 𝗖𝗼𝗱𝗲 𝗙𝗿𝗼𝗺 𝗔𝗜

𝗛𝗼𝘄 𝘁𝗼 𝗛𝗮𝗻𝗱𝗹𝗲 𝗙𝗹𝗮𝗸𝘆 𝗔𝗜 𝗔𝗣𝗜𝘀

למה הפסקתי להסתמך על ספק AI אחד