הסכנה הגדולה ביותר ל-AI

רוב האנשים מפחדים ממכונה שמתעוררת לחיים.

הסכנה האמיתית שקטה יותר.

ייתכן שה-AI לא ייכשל בגלל שהוא יהיה חכם מדי. הוא עלול להיכשל בגלל שאנחנו נרעיל את הנתונים עליהם הוא לומד.

עד שנת 2029, המודלים יהיו גדולים יותר. יהיה להם יכולת הסקה טובה יותר ויהיו להם יותר סוכנים (agents). חברות יסמכו עליהם יותר.

המודלים הללו מתאמנים על האינטרנט. הם קוראים בלוגים, פורומים, רשתות חברתיות ומאמרים מחקריים.

אבל האינטרנט משתנה.

בוטים, חברות וקבוצות פוליטיות מפרסמים כעת תוכן בקנה מידה עצום. הם לא רק מפרסמים ספאם. הם מפרסמים תוכן כתוב היטב ואמין.

האינטרנט הופך לשדה קרב עבור מאגרי נתונים (datasets) לאימון.

תעמולה מסורתית מכוונת לאנשים. בעולם של AI, המטרה היא המודל עצמו.

אם שקר או הטיות חודרים לנתוני האימון, הם הופכים לחלק מה-AI. הם לא נשארים כציטוט. הם הופכים להנחה ברירת מחדל. הם הופכים לתשובה שנשמעת נכונה.

זה לא רק התקפה טכנית. זהו שינוי מעודן.

המטרה היא לא לשבור את המודל. המטרה היא לעקם אותו.

שקלו את הסיכונים הבאים:

  • אלפי דפים מזויפים גורמים למוצר להיראות בטוח.
  • צ'אטים מזויפים של מפתחים גורמים לקוד לא מאובטח להיראות כמו פרקטיקה מומלצת (best practice).
  • סיפורים פוליטיים מושתלים שנים לפני בחירות.
  • דעות סינתטיות הופכות לקול של העוזרים העתידיים.

הסכנה היא לא שקר אחד. הסכנה היא מפה מעוותת של המציאות.

האינטרנט נוצר לתקשורת ולמסחר. הוא לא נוצר כדי להיות מאגר נתונים נקי.

אנשים כותבים כעת עבור מודלים עתידיים במקום עבור קוראים אנושיים.

  • פוסט בבלוג הופך לזרע.
  • ביקורת מזויפת הופכת לאות אימון (training signal).
  • מאמר טכני הופך להצעה התנהגותית.

אלף שקרים קטנים הופכים לאמת סטטיסטית.

ה-AI יורש את המסמכים שלנו, את הרעש שלנו ואת המניפולציות שלנו. אם האינטרנט יישאר מזוהם, המודלים ילמדו מהעיוותים שלנו.

השאלה היא לא רק "איך נהפוך את ה-AI לבטוח?"

השאלה האמיתית היא "איך נשמור על הידע שלנו בטוח עבור ה-AI כדי שיוכל ללמוד ממנו?"

המודלים של מחר לומדים מהאינטרנט של היום. ואנשים כבר כותבים עבור המודלים האלה.

מקור: https://dev.to/marrouchi/the-greatest-danger-to-ai-6km