𝗔𝗜 𝗠𝗼𝗱𝗲𝗹𝘀 𝗔𝗰𝘁𝘂𝗮𝗹𝗹𝘆 𝗪𝗼𝗿𝗸

AIを使ってメールを書いたり、コードを修正したりします。多くの人はそれをアルゴリズムと呼びますが、その仕組みまでは知りません。数学的なプロセスは複雑ですが、考え方自体はシンプルです。

核となる考え方は「予測」です。

もし「The cat sat on the(猫は〜の上に座った)」と入力したら、モデルは次の単語を予測します。その単語が持つ確率が高いことから、「mat(マット)」を選びます。これを単語ごとに繰り返して、完全な文章を構築します。単語をうまく予測するために、モデルは文法、事実、そして論理を学習します。

次の4つのステップがあります。

  1. トークン (Tokens) モデルは単語を読みません。数字を読みます。テキストを「トークン」と呼ばれる小さな断片に分割します。すべてのトークンは数字のリストになります。あらゆる会話の裏側では、大規模な数学的処理が行われています。

  2. 学習 (Training) 学習はモデルが学ぶためのプロセスです。本やウェブサイトから得た数十億ページものデータをモデルに見せます。モデルはトークンを予測し、正解を確認します。もし間違っていれば、システムは内部設定を調整します。これを何兆回も繰り返します。人間がルールを書くわけではありません。モデルは自らパターンを見つけ出します。

  3. アテンション (Attention) これはモデルが文脈を理解するのを助けます。「The trophy did not fit in the suitcase because it was too big(トロフィーはスーツケースに入らなかった。なぜならそれが大きすぎたからだ)」という文章では、「it」はトロフィーを指しています。アテンションは、どの前の単語が最も重要であるかをモデルに伝えます。これにより、モデルは長い段落にわたって意味を追跡できるようになります。

  4. ファインチューニング (Fine-tuning) 未調整のモデルは単なる予測エンジンに過ぎません。ファインチューニングによって、モデルはアシスタントとしての振る舞いを学びます。人間が回答を評価します。モデルはそれらの評価に基づき、役立つ安全な回答を提供することを学びます。

送信ボタンを押すと何が起きるのか?

あなたのテキストは数字に変換されます。その数字が数学的なレイヤー(層)を通り抜けます。モデルは次のトークンの確率を計算します。トークンを一つ選び、返答が完了するまでそのプロセスを繰り返します。これは数秒で行われます。

AIは魔法ではありません。大規模なスケールで行われる予測なのです。これを知ることで、あなたはツールをより使いこなせるようになります。

Source: https://dev.to/rameshkumarramu/ai-models-how-do-they-actually-work-2kmm

Optional learning community: https://t.me/GyaanSetuAi