Модель не помнит. Помните вы.

Translated for your language. Читать оригинал.

AI-assisted draft.

позавчера1мин чтения

Модель ничего не помнит. Помните вы.

Раньше я думал, что у больших языковых моделей (LLM) есть память.

Я думал, что каждая сессия чата хранит свой собственный контекст. Я ошибался.

LLM не имеют состояния (stateless). Модель ничего не помнит от одного запроса к другому.

Когда вы видите историю чата, вы видите массив сообщений. Чтобы создать диалог, вы должны отправлять всю историю обратно модели с каждым новым промптом.

Если вы используете SDK, этот процесс остается скрытым. SDK берет на себя всю сложность.

Если вы используете «сырой» fetch, вы видите всё. Вы сами управляете заголовками, телом запроса и массивом сообщений.

Вот как работает контекст:

• Вы отправляете сообщение. • Модель отвечает. • Вы сохраняете оба сообщения в массив. • Вы отправляете весь массив обратно для следующего вопроса.

Модель знает только то, что вы отправляете в текущем запросе. Всё остальное исчезает.

Понимание этого массива — это основа разработки ИИ. Это отправная точка для таких продвинутых методов, как RAG, скользящие окна (sliding windows) и семантический поиск.

Если вы хотите создавать надежные ИИ-инструменты, перестаньте полагаться на абстракции. Изучайте «сырые» запросы. Управляйте историей самостоятельно.

Полный пост: https://dev.to/marcochavezco/the-model-doesnt-remember-you-do-38jk

Модель не помнит. Помните вы.

Продолжить чтение

Управление контекстом диалога для ИИ

Почему ИИ-персонажи теряют свою идентичность

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗗𝗼𝗻'𝘁 𝗡𝗲𝗲𝗱 𝗠𝗼𝗿𝗲 𝗠𝗲𝗺𝗼𝗿𝘆. 𝗧𝗵𝗲𝘆 𝗡𝗲𝗲𝗱 𝗚𝗼𝘃𝗲𝗿𝗻𝗲𝗱 𝗥𝗲𝗰𝗮𝗹𝗹.

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗗𝗼𝗲𝘀𝗻'𝘁 𝗥𝗲𝗺𝗲𝗺𝗯𝗲𝗿. 𝗬𝗼𝘂 𝗗𝗼.

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗗𝗼𝗲𝘀𝗻'𝘁 𝗥𝗲𝗺𝗲𝗺𝗯𝗲𝗿. 𝗬𝗼𝘂 𝗗𝗼.