Модель не пам'ятає. Пам'ятаєте ви.

Translated for your language. Read the original.

AI-assisted draft.

позавчора1min read

Модель нічого не пам'ятає. Пам'ятаєте ви.

Раніше я думав, що великі мовні моделі (LLM) мають пам'ять.

Я вважав, що кожен чат-сеанс зберігає власний контекст. Я помилявся.

LLM є безстанними (stateless). Модель нічого не пам'ятає від одного запиту до іншого.

Коли ви бачите історію чату, ви насправді бачите масив повідомлень. Щоб створити розмову, ви повинні надсилати всю історію назад моделі з кожним новим промптом.

Якщо ви використовуєте SDK, цей процес залишається прихованим. SDK бере на себе всю складність.

Якщо ви використовуєте raw fetch, ви бачите все. Ви самостійно керуєте заголовками, тілом запиту та масивом повідомлень.

Ось як працює контекст:

• Ви надсилаєте повідомлення. • Модель відповідає. • Ви зберігаєте обидва повідомлення в масиві. • Ви надсилаєте весь масив назад для наступного запитання.

Модель знає лише те, що ви надсилаєте в поточному запиті. Все інше зникає.

Розуміння цього масиву є основою розробки ШІ. Це відправна точка для таких просунутих методів, як RAG, ковзні вікна (sliding windows) та семантичний пошук.

Якщо ви хочете створювати надійні інструменти ШІ, припиніть покладатися на абстракції. Дивіться на сирі (raw) запити. Керуйте історією самостійно.

Повний пост: https://dev.to/marcochavezco/the-model-doesnt-remember-you-do-38jk

Модель не пам'ятає. Пам'ятаєте ви.

Continue reading

Управління контекстом розмови для ШІ

Чому ШІ-персонажі забувають свою ідентичність

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗗𝗼𝗻'𝘁 𝗡𝗲𝗲𝗱 𝗠𝗼𝗿𝗲 𝗠𝗲𝗺𝗼𝗿𝘆. 𝗧𝗵𝗲𝘆 𝗡𝗲𝗲𝗱 𝗚𝗼𝘃𝗲𝗿𝗻𝗲𝗱 𝗥𝗲𝗰𝗮𝗹𝗹.

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗗𝗼𝗲𝘀𝗻'𝘁 𝗥𝗲𝗺𝗲𝗺𝗯𝗲𝗿. 𝗬𝗼𝘂 𝗗𝗼.

Модель не пам'ятає. Пам'ятаєте ви.