הסקת מסקנות בשרשרת מחשבה ללא הנחיה

מודלי שפה גדולים מתקשים לעיתים קרובות בלוגיקה מורכבת.

רוב האנשים משתמשים ב-Chain-of-Thought prompting כדי לפתור זאת. אתם אומרים למודל לחשוב צעד אחר צעד. זה מחייב את המודל להציג את תהליך העבודה שלו.

מחקר חדש מציג דרך אחרת. אין צורך להנחות את המודל לחשוב צעד אחר צעד.

ניתן להשיג תוצאות דומות באמצעות שינויים ארכיטקטוניים. שיטה זו עובדת מבלי להוסיף מילים נוספות להנחיה שלכם.

איך זה עובד:

  • המודל מעבד מידע בשלבים.
  • הוא משתמש במסלולי הסקה פנימיים.
  • הוא פותר בעיות לפני מתן התשובה הסופית.

הגישה הזו חוסכת טוקנים. היא הופכת את ההנחיות שלכם לקצרות יותר. היא מפחיתה את עלות ההרצה של מודלי AI.

אתם מקבלים לוגיקה טובה יותר ללא הקלט הנוסף.

מקור: https://dev.to/paperium/chain-of-thought-reasoning-without-prompting-3n91

קהילת למידה אופציונלית: https://t.me/GyaanSetuAi