𝗡𝗼𝗯𝗼𝗱𝘆 𝗪𝗮𝗻𝘁𝘀 𝗬𝗼𝘂𝗿 𝟳𝟬𝗕 𝗣𝗮𝗿𝗮𝗺𝗲𝘁𝗲𝗿 𝗠𝗼𝗱𝗲𝗹 𝗔𝗻𝘆𝗺𝗼𝗿𝗲

Translated for your language. Read the original.

AI-assisted draft.

לפני 20 שעות2min read

אף אחד כבר לא רוצה את המודל שלך עם 70B פרמטרים

עולם ה-AI נהג להתמקד רק בקנה מידה.

אנשים רדפו אחרי מודלים גדולים יותר, חלונות הקשר (context windows) גדולים יותר ומדדי ביצוע (benchmarks) גדולים יותר. אם המודל שלך לא היה עצום, לא היית במשחק.

העידן הזה מסתיים.

מודלים עצומים הם מרשימים. אבל רוב האנשים לא זקוקים לכוח כזה. עוזר של לוח מחוונים ברכב לא צריך לכתוב שירים. הוא צריך להבין "תוריד את המזגן" ולפעול מבלי לרוקן את הסוללה.

מודלים קטנים ומתמחים תופסים את מקומם מ-5 סיבות עיקריות:

שימוש במכשיר (On-device): לטלפונים יש כיום חומרה להרצת מודלים קטנים באופן מקומי. העוזר שלך יעבוד במנהרה או בטיסה ללא אינטרנט.
פרטיות ורגולציה: בתי חולים ומשרדי עורכי דין לא יכולים לשלוח נתונים רגישים ל-API של צד שלישי. הרצת מודל קטן על חומרה מקומית שומרת על הנתונים בתוך המבנה.
שיהוי (latency) נמוך: מכונית אוטונומית לא יכולה לחכות ששרת בענן יחליט אם צורה מסוימת היא הולך רגל. המודל חייב להתקיים במקום שבו מתקבלת ההחלטה.
עלויות נמוכות יותר: הרצת מיליוני בקשות על מודל עצום הורסת את שולי הרווח שלך. מודל קטן ומכוונן (tuned) הוא לרוב זול ובר-קיימא יותר.
קישוריות גרועה: בחלקים רבים של העולם, האינטרנט אינו קבוע. מודלים קטנים מאפשרים למוצרים לתפקד ללא חיבור (offline).

ניתן להקטין מודלים באמצעות שלוש שיטות עיקריות:

קוונטיזציה (Quantization): הפחתת הדיוק של משקלי המודל כדי לחסוך במקום.
גיזום (Pruning): הסרת קשרים מיותרים שאינם מוסיפים ערך.
זיקוק ידע (Knowledge distillation): שימוש במודל גדול כדי ללמד מודל קטן איך לחקות את הלוגיקה שלו.

השינוי הזה משנה את מערך הכישורים הנדרש.

כתיבת פרומפטים (Prompting) למודל ענק היא מיומנות אחת. בחירה, כוונון עדין (fine-tuning) ופריסה של מודל מתמחה הן אתגר הנדסי אחר. מדובר בעשיית איזונים (tradeoffs) בין מהירות, עלות ודיוק.

הפסיקו לנסות לבנות כלי ענק אחד שעושה הכל בצורה גרועה. בנו כמה כלים קטנים שעושים דבר אחד היטב.

מודל קטן הוא לא ירידה ברמה (downgrade). הוא כלי טוב יותר למשימה.

מקור: https://dev.to/blakcodes/nobody-wants-your-70b-parameter-model-anymore-56jo

קהילת למידה אופציונלית: https://t.me/GyaanSetuAi

𝗡𝗼𝗯𝗼𝗱𝘆 𝗪𝗮𝗻𝘁𝘀 𝗬𝗼𝘂𝗿 𝟳𝟬𝗕 𝗣𝗮𝗿𝗮𝗺𝗲𝘁𝗲𝗿 𝗠𝗼𝗱𝗲𝗹 𝗔𝗻𝘆𝗺𝗼𝗿𝗲

Continue reading

AI הוא יותר מסתם פרומפטים

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

כאשר חלונות הקשר מפסיקים להיות משמעותיים

𝗪𝗵𝘆 𝗔𝗜 𝗡𝗲𝗲𝗱𝘀 𝗦𝘁𝗮𝘁𝗲 𝗠𝗮𝗻𝗮𝗴𝗲𝗺𝗲𝗻𝘁 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗕𝗶𝗴𝗴𝗲𝗿 𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗪𝗶𝗻𝗱𝗼𝘄𝘀

𝗧𝗵𝗲 𝗙𝘂𝘁𝘂𝗿𝗲 𝗼𝗳 𝗔𝗜 𝗜𝘀 𝗡𝗼𝘁 𝗔𝗯𝗼𝘂𝘁 𝗠𝗼𝗱𝗲𝗹𝘀. 𝗜𝘁'𝘀 𝗔𝗯𝗼𝘂𝘁 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴.