לשבור את תיבת הצ'אט של ה-AI
רוב הדגמות ה-AI נראות אותו הדבר. אתם רואים חלון צ'אט. אתם מקלידים פרומפט. אתם צופים בטקסט שזורם פנימה. הממשק הזה הוא מלכודת. הוא מאמן אתכם לשאול שאלות במקום לבנות פתרונות.
סטודנטים למדעי המחשב בברקלי מצאו דרך טובה יותר. הם הפסיקו להשתמש בתיבות צ'אט עבור שיעורי הבית שלהם באלגוריתמים. במקום זאת, הם בנו סוכנים אוטונומיים (autonomous agents). הסוכנים האלה לא מנהלים צ'אט. הם מתכננים, מריצים קוד ושולחים את התוצאות באימייל.
איך המערכת עובדת:
• מתכנן משימות (Task Planner): מודל LLM קל משקל הופך מטרה לרשימת JSON של תת-משימות. לכל משימה יש כלל הצלחה ברור. • מריץ קוד (Code Executor): מודל LLM נפרד כותב סקריפטים ב-Python עבור כל משימה. הסקריפטים הללו רצים בתוך Docker sandbox. זה שומר על המחשב שלכם בטוח. אם הקוד נכשל, הסוכן מנסה שוב עם הודעת השגיאה. • מאגר SQLite: זהו הזיכרון של הסוכן. במקום להשתמש בהיסטוריית צ'אט עצומה, הסוכן קורא וכותב נתונים למסד נתונים מקומי. זה שומר על עלויות נמוכות ומונע שגיאות. • מרכז אימיילים (Email Aggregator): אתם לא צופים בסוכן עובד. כשהעבודה מסתיימת, הסוכן שולח לכם אימייל עם דוח מלא הכולל את התוצאות ואת הקוד ששימש לביצוע.
למה זה מנצח את ChatGPT:
- עלות: שימוש במודלים קטנים דרך OpenRouter עולה סנטים, לא דולרים.
- זיכרון: שימוש במסד נתונים במקום בחלון הקשר (context window) מונע מהסוכן להתבלבל.
- אמינות: הסוכן משתמש בקוד כדי לאמת תוצאות. אתם מקבלים מתמטיקה ולוגיקה, לא רק טקסט.
- אבטחה: ה-sandbox מבטיח שהסוכן לא יוכל לגעת בקבצים הפרטיים שלכם.
הארכיטקטורה הזו עובדת עבור ניתוח נתונים, עיבוד קבצים ומתמטיקה. היא לא עובדת עבור כתיבה יצירתית או משימות סובייקטיביות. אלו עדיין דורשות אדם.
הפסיקו להשתמש בצ'אט לעבודה חזרתית. בנו סוכן שעובד בשבילכם בזמן שאתם ישנים.
קהילת למידה אופציונלית: https://t.me/GyaanSetuAi