איך מודלי AI באמת עובדים

אתם משתמשים ב-AI כדי לכתוב אימיילים או לתקן קוד. רוב האנשים קוראים לזה אלגוריתם. הם לא יודעים איך הוא עובד. התהליך פשוט להבנה, גם אם המתמטיקה מורכבת.

הרעיון המרכזי הוא חיזוי.

אם תקלידו "The cat sat on the", המודל יחזה את המילה הבאה. הוא יבחר ב-"mat" כי למילה הזו יש הסתברות גבוהה. הוא חוזר על הלופ הזה מילה אחר מילה כדי לבנות משפט מלא. כדי לחזות מילים היטב, המודל לומד דקדוק, עובדות ולוגיקה.

הנה ארבעת השלבים:

  1. Tokens (טוקנים) מודלים לא קוראים מילים. הם קוראים מספרים. הם מפרקים טקסט לחלקים קטנים שנקראים טוקנים (tokens). כל טוקן הופך לרשימה של מספרים. מתחת לכל שיחה, מתרחשת מתמטיקה בקנה מידה עצום.

  2. Training (אימון) אימון הוא הדרך שבה מודל לומד. מראים לו מיליארדי דפים מספרים ואתרי אינטרנט. המודל חוזה טוקן ובודק את התשובה. אם היא שגויה, המערכת מכווננת את ההגדרות הפנימיות שלה. היא עושה זאת טריליוני פעמים. אף אדם לא כותב עבורו חוקים. המודל מוצא דפוסים בעצמו.

  3. Attention (קשב) זה עוזר למודל להבין הקשר. במשפט "The trophy did not fit in the suitcase because it was too big", המילה "it" מתייחסת לגביע (trophy). מנגנון ה-Attention אומר למודל אילו מילים קודמות הן החשובות ביותר. זה מאפשר למודל לעקוב אחר המשמעות לאורך פסקאות ארוכות.

  4. Fine-tuning (כוונון עדין) מודלים גולמיים הם רק מנועי חיזוי. Fine-tuning מלמד אותם להיות עוזרים. בני אדם מדרגים את התשובות. המודל לומד לספק תגובות מועילות ובטוחות על בסיס הדירוגים הללו.

מה קורה כשלוחצים על "שלח"?

הטקסט שלכם הופך למספרים. המספרים הללו עוברים דרך שכבות של מתמטיקה. המודל מחשב את ההסתברות עבור הטוקן הבא. הוא בוחר טוקן וחוזר על התהליך עד שהתשובה מסתיימת. זה קורה תוך שניות.

AI הוא לא קסם. זהו חיזוי בקנה מידה עצום. הידיעה הזו הופכת אתכם למשתמשים טובים יותר של הכלי.

Source: https://dev.to/rameshkumarramu/ai-models-how-do-they-actually-work-2kmm

Optional learning community: https://t.me/GyaanSetuAi