הסוכן הוא הרתמה, לא המודל
לכל מערכת AI יש שני חלקים: המודל והרתמה (harness).
המודל מספק יכולת הסקה גולמית. הרתמה היא הקוד שעוטף אותו.
Claude Code, GitHub Copilot ו-ChatGPT אינם מודלים. הם רתמות. הם מספקים את הכלים, הזיכרון והלולאות שהופכים מודל למוצר שימושי.
השתמשו בנוסחה זו: סוכן = מודל × רתמה
המודל הוא מרכיב. הרתמה היא המנה.
רוב עבודת ההנדסה מתבצעת בתוך הרתמה. אתם לא מאמנים את המודל. אתם עוטפים את המודל. אתם מחליטים אילו כלים הוא משתמש בהם, כיצד הוא מטפל בשגיאות וכיצד הוא זוכר הקשר (context).
כרגע, חברות כמו OpenAI ו-Anthropic בונות את שני החלקים. הן בונות את המנוע ואת המכונית. זה ישתנה.
העתיד שייך לרתמות שאינן תלויות במודל (model-agnostic).
רתמת קוד זקוקה לגישה למאגרים (repositories) וללולאות בדיקה. רתמה משפטית זקוקה לדיוק בציטוטים. רתמה פיננסית זקוקה למעקבי ביקורת (audit trails). המודל נשאר זהה, אך הרתמה משתנה בהתאם למשימה.
הנדסת רתמות תספח את רוב הנדסת התוכנה הנוכחית.
העבודה עוברת מכתיבת לוגיקה דטרמיניסטית לבניית מערכות שמבצעות אוטומציה לתהליכי עבודה אנושיים.
זה לא אומר ש-AI מחליף את כל הקוד.
- תהליכי ליבה עסקיים כמו תשלומים וספרי חשבונות חייבים להישאר דטרמיניסטיים. אתם לא רוצים שמודל ינחש את הנהלת החשבונות שלכם.
- משימות מונעות אדם כמו מיון (triage) וניהול תהליכי עבודה יעברו לסוכנים.
התפקיד של מפתחים משתנה.
מומחי ML יתמקדו בצד של המודל. מפתחים יתמקדו בצד של הרתמה.
הרתמה היא המקום שבו אתם מחליטים על בטיחות, עלות ואמינות. מודל טוב יותר עם רתמה גרועה הוא רק דרך מהירה יותר להיכשל.
המודל משתפר מעצמו. ההצלחה שלכם תלויה בדרך שבה אתם בונים את הרתמה.
קהילת למידה אופציונלית: https://t.me/GyaanSetuAi