𝗧𝗵𝗲 𝗧𝗵𝗿𝗲𝗲 𝗪𝗼𝗿𝗱𝘀

📅4 hours ago⏱2 min read

שלוש המילים

חוקר הקליד שלוש מילים במודל ה-AI החזק ביותר של Anthropic: fix this code.

תוך תשעים דקות, ממשלת ארצות הברית השביתה את המודל.

הפגיעות הייתה פרומפט פשוט. זו לא הייתה מתקפה מורכבת. המודל סיפק נתונים של אבטחת סייבר שהמערכות הבטיחותיות שלו היו אמורות לחסום.

משרד המסחר השתמש בסמכות בקרת ייצוא כדי לעצור את המודל. הם הורו ל-Anthropic למנוע מכל אזרחים זרים גישה אליו. זה כלל כמה מהמהנדסים של Anthropic עצמה. Anthropic הוציאה את המודלים מהרשת כדי להימנע מהדרה של הצוות שלה.

הסיבה הרשמית הייתה ביטחון לאומי. אך לסיפור יש רובד עמוק יותר.

Amazon גילתה את המעקף. מנכ"ל Amazon, אנדי ג'אסי (Andy Jassy), דיווח על כך לגורמים ממשלתיים.

Amazon היא משקיעה ענקית ב-Anthropic. Amazon מספקת גם את תשתית הענן שבה Anthropic משתמשת. חשוב מכל, מוצרי ה-AI של Amazon עצמה מתחרים ב-Anthropic.

הממצא עבר ממתחרה לממשלה. הוא עקף את החברה שבנתה את המודל.

האירוע הזה מראה שלושה דברים קריטיים:

סיכון מותג: Anthropic בנתה את המוניטין שלה על בטיחות. כשמודל "בטוח" נכשל, המחיר הפוליטי גבוה יותר. המותג הופך לנטל.
מבני כוח חדשים: Amazon פועלת כמשקיעה, כספקית וכמתחרה. לאף תעשייה אחרת אין מבנה כזה. שיחת טלפון אחת ממתחרה יכולה להפעיל מנגנונים משפטיים שישביתו חברה.
התערבות מהירה: הממשלה הוכיחה שהיא יכולה לאלץ חברת AI להשבית את המוצר העיקרי שלה תוך פחות משעתיים. לא הייתה הודעה מוקדמת ולא הייתה אפשרות ערעור.

חברות AI חשבו שהן או שיווסתו את עצמן או שיתמודדו עם מדיניות ממשלתית. הן לא תכננו אפשרות שלישית.

הן לא תכננו רגולציה באמצעות התערבות פתאומית המופעלת על ידי מודיעין תאגידי.

חוקרי בטיחות רצו מנגנוני הגנה (guardrails) ל-AI. הם לא הבינו מי באמת יבנה אותם.

מקור: https://dev.to/thesythesis/the-three-words-3ijl

קהילת למידה אופציונלית: https://t.me/GyaanSetuAi

𝗧𝗵𝗲 𝗧𝗵𝗿𝗲𝗲 𝗪𝗼𝗿𝗱𝘀

Continue reading

𝗧𝗵𝗲 𝗨𝗦 𝗚𝗼𝘃𝗲𝗿𝗻𝗺𝗲𝗻𝘁 𝗥𝗲𝗰𝗮𝗹𝗹𝗲𝗱 𝗔𝗻 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹

מומחי אבטחת סייבר מוחים על האיסור האמריקאי על מודלי Fable ו-Mythos של Anthropic

כיצד השבתת Anthropic הזינה את המאמץ העולמי לבינה מלאכותית ריבונית

מדוע האיסור של ממשל ארה"ב על Anthropic הוא יריית אזהרה רגולטורית

𝗨𝗦 𝗙𝗼𝗿𝗰𝗲𝘀 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝘁𝗼 𝗦𝗵𝘂𝘁 𝗗𝗼𝘄𝗻 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹𝘀