Il modello non ricorda. Tu sì.

Translated for your language. Leggi l'originale.

AI-assisted draft.

l’altro ieri1min di lettura

Il modello non ricorda. Tu sì.

I Large Language Models (LLM) non hanno memoria.

Pensavo che ogni sessione di chat memorizzasse il proprio contesto. Mi sbagliavo. Quando parli con un LLM, non ricorda la tua domanda precedente a meno che tu non la invii nuovamente.

Il modello è stateless. Ciò significa che ogni richiesta è un nuovo inizio.

Per creare una conversazione, devi gestire tu stesso la cronologia. Lo fai inviando un array di tutti i messaggi precedenti con ogni nuova richiesta.

La "memoria" è solo una lista di messaggi:

Utente: Ciao.
Assistant: Ciao!
Utente: Come stai?

Se non includi le prime due righe nella tua prossima richiesta, il modello non saprà che hai già detto ciao.

Ho imparato questo evitando gli SDK. La maggior parte degli sviluppatori usa strumenti come l'Anthropic SDK per nascondere questa complessità. L'SDK gestisce la cronologia dei messaggi e gli header per te.

Se vuoi imparare come funzionano gli LLM, usa invece un raw fetch. Non usare un'astrazione. Quando gestisci manualmente il ciclo di richiesta e risposta, vedi ogni singola decisione.

Questo controllo manuale ti permette di costruire strategie avanzate in seguito, come:

Sliding window per gestire chat lunghe.
Retrieval Augmented Generation (RAG).
Ricerca semantica.

Comprendere questo array è la base dello sviluppo dell'IA. Sei tu a fornire il contesto. Il modello conosce solo ciò che gli invii.

Fonte: https://dev.to/marcochavezco/the-model-doesnt-remember-you-do-3mmk

Il modello non ricorda. Tu sì.

Continua a leggere

𝗪𝗵𝘆 𝗔𝗜 𝗖𝗵𝗮𝗿𝗮𝗰𝘁𝗲𝗿𝘀 𝗙𝗼𝗿𝗴𝗲𝘁 𝗧𝗵𝗲𝗶𝗿 𝗜𝗱𝗲𝗻𝘁𝗶𝘁𝘆

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗗𝗼𝗻'𝘁 𝗡𝗲𝗲𝗱 𝗠𝗼𝗿𝗲 𝗠𝗲𝗺𝗼𝗿𝘆. 𝗧𝗵𝗲𝘆 𝗡𝗲𝗲𝗱 𝗚𝗼𝘃𝗲𝗿𝗻𝗲𝗱 𝗥𝗲𝗰𝗮𝗹𝗹.

Il modello non ricorda. Tu sì.

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗗𝗼𝗲𝘀𝗻'𝘁 𝗥𝗲𝗺𝗲𝗺𝗯𝗲𝗿. 𝗬𝗼𝘂 𝗗𝗼.

LLM per la comprensione del linguaggio