𝗜 𝗧𝗿𝗶𝗲𝗱 𝗧𝗼 𝗔𝗱𝗱 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗧𝗼 𝗠𝘆 𝗔𝗽𝗽 𝗔𝗻𝗱 𝗛𝗶𝘁 𝗔 𝗪𝗮𝗹𝗹

Translated for your language. Читать оригинал.

AI-assisted draft.

позавчера2мин чтения

Я пытался добавить ИИ-чат в свое приложение и уперся в стену

Я пытался добавить ИИ-ассистента в свой инструмент для управления проектами. Я думал, что это будет легко. Я планировал отправлять всю историю чата в API.

Ничего не вышло.

После 15 сообщений ответы стали медленными или начали ломаться. API выдавал ошибки, так как текст превышал лимит токенов.

Вот что я пробовал и что сработало.

Проблемы, с которыми я столкнулся:

Обрезка истории: я оставлял только последние несколько сообщений. Это решило проблему со скоростью, но ИИ забывал всё, что было в начале чата.
Суммаризация: я просил ИИ резюмировать чат каждые 5 сообщений. Это помогло с памятью, но увеличило расходы и время ожидания.
Векторные хранилища: я пробовал ранжировать сообщения по релевантности. Это добавило слишком много сложности для моих задач.

Решение:

Я перестал пытаться отправлять всё подряд. Чтобы улучшить пользовательский опыт, я использовал два основных метода.

Стриминг: я использовал Server-Sent Events, чтобы показывать текст по мере его генерации. Это создает ощущение быстроты приложения, даже если ИИ требуется время на «раздумья».
Трехслойное контекстное окно: я разделил свой бюджет токенов на конкретные части.

System Prompt: 500 токенов. Эта часть остается неизменной.
Dynamic Context: 2000 токенов. Здесь хранятся последние обновления проекта и состояния задач.
Conversation History: 4000 токенов. Это скользящее окно последних сообщений.

Управляя бюджетом таким образом, я сократил размер полезной нагрузки на 40%. Это сэкономило деньги и снизило задержку (latency).

Мой совет:

Добавление ИИ — это не просто вызов API. Вы должны управлять объемом отправляемых данных. Стриминг улучшает восприятие скорости пользователем. Умная стратегия контекста улучшает восприятие «интеллекта» ИИ.

А как вы управляете памятью диалогов в своих приложениях? Используете скользящие окна или суммаризацию?

Источник: https://dev.to/__c1b9e06dc90a7e0a676b/i-tried-to-add-ai-chat-to-my-app-and-hit-a-wall-with-context-tokens-459b

Опциональное сообщество для обучения: https://t.me/GyaanSetuAi

𝗜 𝗧𝗿𝗶𝗲𝗱 𝗧𝗼 𝗔𝗱𝗱 𝗔𝗜 𝗖𝗵𝗮𝘁 𝗧𝗼 𝗠𝘆 𝗔𝗽𝗽 𝗔𝗻𝗱 𝗛𝗶𝘁 𝗔 𝗪𝗮𝗹𝗹

Продолжить чтение

Управление контекстом диалога для ИИ

Как я не дал своей ИИ-функции опустошить мой кошелек

𝗛𝗼𝘄 𝗜 𝗙𝗶𝘅𝗲𝗱 𝗔𝗜 𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝗪𝗶𝘁𝗵 𝗦𝘁𝗿𝗲𝗮𝗺𝗶𝗻𝗴 𝗮𝗻𝗱 𝗖𝗮𝗰𝗵𝗶𝗻𝗴

Я пытался добавить ИИ-чат в свое приложение и зашел в тупик

𝗦𝘁𝗼𝗽 𝗧𝗲𝗹𝗹𝗶𝗻𝗴 𝗬𝗼𝘂𝗿 𝗔𝗜 𝘁𝗼 𝗯𝗲 𝗰𝗮𝗿𝗲𝗳𝘂𝗹