𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗗𝗼𝗲𝘀𝗻'𝘁 𝗥𝗲𝗺𝗲𝗺𝗯𝗲𝗿. 𝗬𝗼𝘂 𝗗𝗼.

Translated for your language. 原文を読む.

AI-assisted draft.

一昨日1分で読めます

モデルは覚えていない。あなたが覚えているのだ。

大規模言語モデル（LLM）にはメモリがありません。

以前は、チャットセッションごとにコンテキストが保存されていると思っていました。しかし、それは間違いでした。LLMと会話するとき、前の質問を再度送らない限り、モデルは直前の質問を覚えていません。

モデルはステートレス（stateless）です。つまり、すべてのリクエストがゼロからのスタートであることを意味します。

会話を成立させるには、履歴を自分で管理する必要があります。具体的には、新しいリクエストを送るたびに、これまでのすべてのメッセージの配列を一緒に送信します。

「メモリ」とは、単なるメッセージのリストに過ぎません：

次のリクエストに最初の2行を含めなければ、モデルはあなたがすでに挨拶したことを知りません。

私はSDKを避けることで、この仕組みを学びました。ほとんどの開発者は、Anthropic SDKのようなツールを使って、この複雑さを隠蔽しています。SDKがメッセージ履歴やヘッダーを代わりに処理してくれるからです。

LLMがどのように動作するかを学びたいのであれば、代わりに生の fetch を使用してください。抽象化されたもの（abstraction）は使わないでください。リクエストとレスポンスのサイクルを手動で管理することで、あらゆる決定プロセスが見えてきます。

この手動による制御により、後から以下のような高度な戦略を構築できるようになります：

この配列を理解することが、AI開発の基礎となります。コンテキストを提供しているのはあなた自身です。モデルは、あなたが送った内容しか知りません。

続きを読む