من کلیدها را به Claude Code دادم. یک کرم هم همین کار را کرد.

عوامل کدنویسی هوش مصنوعی (AI coding agents) دچار جیل‌بریک نمی‌شوند. آن‌ها دقیقاً همان کاری را انجام می‌دهند که برای انجامش ساخته شده‌اند. آن‌ها از اعتبارنامه‌های (credentials) شما برای اجرای دستورات استفاده می‌کنند. مشکل اینجاست که مهاجمان می‌توانند ورودی را تأمین کنند.

آسیب‌پذیری‌های اخیر سه روش مختلف برای وقوع این اتفاق نشان می‌دهند.

مسئله اصلی ساده است. یک عامل کدنویسی، مرز بین داده‌ها و دستورات را از بین می‌برد. یک مدل زبانی بزرگ (LLM) دستورالعمل‌ها و داده‌های خارجی را یکسان می‌بیند. هیچ مرزی بین آنچه شما می‌گویید و آنچه دنیا به عامل می‌گوید، وجود ندارد.

چگونه از خود محافظت کنید:

با عامل هوش مصنوعی خود مانند هر فرآیند سطح‌بالای (high-privilege) دیگری رفتار کنید. این عامل به مرزهای سخت‌گیرانه نیاز دارد.

اگر عوامل را در حالت اجرای خودکار (auto-run) اجرا می‌کنید، چگونه تصمیم می‌گیرید که چه زمانی اجازه کار به آن‌ها را بدهید و چه زمانی متوقفشان کنید؟

Source: https://dev.to/kkierii/i-gave-claude-code-the-keys-so-did-a-worm-34a4

Optional learning community: https://t.me/GyaanSetuAi