𝗜 𝗧𝗿𝗶𝗲𝗱 𝗧𝗼 𝗔𝗱𝗱 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗧𝗼 𝗠𝘆 𝗔𝗽𝗽 𝗔𝗻𝗱 𝗛𝗶𝘁 𝗔 𝗪𝗮𝗹𝗹

Translated for your language. Read the original.

AI-assisted draft.

שלשום2min read

ניסיתי להוסיף צ'אט AI לאפליקציה שלי ונתקלתי בקיר

ניסיתי להוסיף עוזר צ'אט מבוסס AI לכלי לניהול פרויקטים שלי. חשבתי שזה יהיה קל. תכננתי לשלוח את כל היסטוריית הצ'אט ל-API.

זה נכשל.

אחרי 15 הודעות, התגובות הפכו לאיטיות או נשברו. ה-API זרק שגיאות מכיוון שהטקסט היה ארוך מדי עבור מגבלת ה-tokens.

הנה מה שניסיתי ומה שעבד.

הבעיות שנתקלתי בהן:

קיצור היסטוריה (Truncating): שמרתי רק את ההודעות האחרונות. זה פתר את בעיית המהירות, אבל ה-AI שכח הכל מתחילת הצ'אט.
סיכום (Summarization): ביקשתי מה-AI לסכם את הצ'אט כל 5 הודעות. זה עזר לזיכרון, אבל הגדיל את העלויות ואת זמני ההמתנה שלי.
Vector stores: ניסיתי לדרג הודעות לפי רלוונטיות. זה הוסיף יותר מדי מורכבות לצרכים שלי.

הפתרון:

הפסקתי לנסות לשלוח הכל. השתמשתי בשתי שיטות עיקריות כדי לשפר את החוויה.

Streaming: השתמשתי ב-Server-Sent Events כדי להציג את הטקסט בזמן שהוא נוצר. זה גורם לאפליקציה להרגיש מהירה גם אם ה-AI לוקח זמן לחשוב.
חלון הקשר (Context Window) בעל שלושה תאים: חילקתי את תקציב ה-tokens שלי לחלקים ספציפיים.

System Prompt: 500 tokens. זה נשאר קבוע.
Dynamic Context: 2000 tokens. זה מחזיק עדכוני פרויקט וסטטוס משימות אחרונים.
Conversation History: 4000 tokens. זהו חלון נעים (sliding window) של הודעות אחרונות.

על ידי ניהול התקציב בצורה כזו, הפחתתי את גודל ה-payload ב-40%. זה חסך כסף והוריד את ה-latency.

העצה שלי:

הוספת AI היא לא רק קריאה ל-API. אתם חייבים לנהל כמה נתונים אתם שולחים. Streaming משפר את תחושת המהירות של המשתמש. אסטרטגיית הקשר (context) חכמה משפרת את תחושת האינטליגנציה של ה-AI.

איך אתם מנהלים את זיכרון השיחה באפליקציות שלכם? אתם משתמשים ב-sliding windows או בסיכום (summarization)?

מקור: https://dev.to/__c1b9e06dc90a7e0a676b/i-tried-to-add-ai-chat-to-my-app-and-hit-a-wall-with-context-tokens-459b

קהילת למידה אופציונלית: https://t.me/GyaanSetuAi

𝗜 𝗧𝗿𝗶𝗲𝗱 𝗧𝗼 𝗔𝗱𝗱 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗧𝗼 𝗠𝘆 𝗔𝗽𝗽 𝗔𝗻𝗱 𝗛𝗶𝘁 𝗔 𝗪𝗮𝗹𝗹

Continue reading

𝗖𝗼𝗻𝘃𝗲𝗿𝘀𝗮𝘁𝗶𝗼𝗻 𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗠𝗮𝗻𝗮𝗴𝗲𝗺𝗲𝗻𝘁 𝗳𝗼𝗿 𝗔𝗜

𝗛𝗼𝘄 𝗜 𝗦𝘁𝗼𝗽𝗽𝗲𝗱 𝗠𝘆 𝗔𝗜 𝗙𝗲𝗮𝘁𝘂𝗿𝗲 𝗳𝗿𝗼𝗺 𝗗𝗿𝗮𝗶𝗻𝗶𝗻𝗴 𝗠𝘆 𝗪𝗮𝗹𝗹𝗲𝘁

𝗛𝗼𝘄 𝗜 𝗙𝗶𝘅𝗲𝗱 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝗪𝗶𝘁𝗵 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗮𝗻𝗱 𝗖𝗮𝗰𝗵𝗶𝗻𝗴

𝗜 𝗧𝗿𝗶𝗲𝗱 𝗧𝗼 𝗔𝗱𝗱 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗧𝗼 𝗠𝘆 𝗔𝗽𝗽 𝗔𝗻𝗱 𝗛𝗶𝘁 𝗔 𝗪𝗮𝗹𝗹

𝗦𝘁𝗼𝗽 𝗧𝗲𝗹𝗹𝗶𝗻𝗴 𝗬𝗼𝘂𝗿 𝗔𝗜 𝘁𝗼 𝗯𝗲 𝗰𝗮𝗿𝗲𝗳𝘂𝗹