מרגרט אטווד מזהירה: מדוע ה-AI עדיין תקוע ב-"Garbage In, Garbage Out"

הסופרת המצטיינת מרגרט אטווד שיתפה לאחרונה ביקורת חריפה על מודלי שפה גדולים (LLMs), תוך הדגשת המאבק המתמשך בדיוק ובשלמות הנתונים. הניסיון שלה מדגיש אמת יסודית בעידן ה-AI הנוכחי: גם המודלים המתקדמים ביותר מוגבלים על ידי איכות נתוני האימון שלהם.

ניסוי ה-Claude: שיעור בהזיות

במהלך פסטיבל Babell הספרותי והתרבותי בפורטו, פורטוגל, חשפה מחברת Handmaid’s Tale את החוויה הבודדת שלה בשימוש ב-Claude של Anthropic. הניסיון של אטווד להשתמש בצ'אטבוט כדי לשלוף מידע על סדרת הבלשים הבריטית Father Brown הסתיים בכישלון הממחיש בצורה מושלמת את המושג "הזיה" (hallucination).

לדברי אטווד, המודל סיפק מידע שגוי, ובפועל "שיקר" למשתמש. היא ציינה כי ה-LLM ככל הנראה סרק ודגם כמויות עצומות של ביקורות טלוויזיה, אך מכיוון שביקורות ברשת נמנעות בדרך כלל מספוילרים, המודל הוטה על ידי התבניות שנמצאו בסט האימון שלו. הבחנה טכנית זו מדגישה אתגר מרכזי עבור מפתחים: LLMs הם מנועים הסתברותיים שמתעדפים התאמת תבניות על פני אימות עובדתי, מה שמוביל לעיתים קרובות לפלטים בטוחים אך שגויים.

דילמת הנתונים: Garbage In, Garbage Out

הביקורת של אטווד מתמקדת בעיקרון מחשוב נצחי: "garbage in, garbage out" (זבל נכנס, זבל יוצא). היא ציינה כי LLMs מאומנים על מידע שנאסף (scraped), פורסם בעבר ועלול להיות מיושן. כאשר מזינים למודל נתונים שאינם מלאים, מוטים או חסרי עקביות לוגית, הפלט שיתקבל ישקף בהכרח את הפגמים הללו.

עבור נוף ה-AI הרחב יותר, זה משמש כתזכורת לכך שהגדלת פרמטרים של מודלים אינה תחליף לאיכות הנתונים. בעוד מפתחים דוחפים לעבר מאגרי נתונים גדולים יותר כדי להגביר את יכולות ההסקה, ה"רעש" בתוך מאגרים אלו — כמו היעדר ספוילרים בעלילה בביקורות שהוזכרו על ידי אטווד — יכול ליצור שגיאות שיטתיות שאפילו ארכיטקטורות מתוחכמות כמו Claude אינן יכולות להתגבר עליהן בקלות.

החשש האתי: אופורטוניזם מול יצירתיות

מעבר למגבלות הטכניות, אטווד התייחסה למרכיב האנושי באימוץ ה-AI. היא כינתה את אלו הנשענים בכבדות על AI כ"אופורטוניסטים" המחפשים דרך קלה לעקוף את הדרישות המחמירות של יצירה או מחקר אמיתיים. היא הזהירה כי הפיתוי "לרמות" באמצעות תוכן שנוצר על ידי AI שאינו ניתן לזיהוי הוא דאגה גוברת עבור תעשיות הנשענות על אינטלקט וניואנסים אנושיים.

עבור מייסדים ואנשי טכנולוגיה, ההבחנה הזו היא חיונית. בעוד ש-AI יכול לשמש ככלי פרודוקטיבי עוצמתי, התצפית של אטווד ש"אפילו אנשים שמשתמשים בו מסיבות עסקיות חייבים לבדוק אותו" מדגישה כי פיקוח אנושי נותר מרכיב בלתי נפרד מתהליך העבודה עם AI. עידן ה-AI האוטונומי לחלוטין והנטול שגיאות הוא עדיין תחזית רחוקה, והאחריות לאמת נותרת בידי המשתמש.

נקודות מפתח

  • שלמות הנתונים היא בעלת חשיבות עליונה: עיקרון ה-"garbage in, garbage out" נותר המכשול הגדול ביותר עבור LLMs, שכן המודלים מוגבלים על ידי האיכות והשלמות של נתוני האימון שלהם.
  • מלכודת ההזיות: אפילו מודלים מתקדמים כמו Claude של Anthropic עלולים להיכשל בשליפת עובדות פשוטות אם התבניות הבסיסיות בנתוני האימון שלהם מטעות.
  • הצורך בפיקוח אנושי: יש לראות ב-AI כלי הדורש אימות מתמיד, ולא כתחליף למומחיות אנושית ולחשיבה ביקורתית.