𝗟𝗟𝗠 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗶𝗻 𝗣𝗿𝗮𝗰𝘁𝗶𝗰𝗲: 𝗪𝗵𝗮𝘁 𝗪𝗼𝗿𝗸𝘀

Translated for your language. Read the original.

AI-assisted draft.

پریروز1min read

کاربرد عملی حفاظ‌های LLM: چه چیزی موثر است

مدل‌های زبانی بزرگ (LLMs) غیرقابل پیش‌بینی هستند. آن‌ها دچار توهم می‌شوند، داده‌ها را فاش می‌کنند و محتوای مضر تولید می‌کنند.

حفاظ‌ها (Guardrails) مدل را کنترل نمی‌کنند، بلکه ریسک را کنترل می‌کنند.

شما باید تصمیم بگیرید که کدام حفاظ‌ها اهمیت دارند و کدام‌یک صرفاً سر و صدا (noise) هستند.

حفاظ‌های ورودی

ورودی بد منجر به خروجی بد می‌شود. همچنین باعث تزریق دستور (prompt injection) می‌گردد.

پاکسازی الگوها: دستوراتی مانند «دستورات قبلی را نادیده بگیر» را در همان ابتدا حذف کنید.
محدودیت طول: برای جلوگیری از هدررفت توکن و اتمام زمان (timeout)، حداکثر تعداد کاراکتر را تعیین کنید.
فیلترینگ محتوا: موضوعاتی مانند خشونت یا نفرت‌پراکنی را مسدود کنید. برای دقت بیشتر، به جای تطبیق ساده رشته‌ای (string matching)، از یک مدل طبقه‌بندی‌کننده (classifier) کوچک استفاده کنید.

حفاظ‌های خروجی

شما باید آنچه را که مدل بازمی‌گرداند بررسی کنید.

اعتبارسنجی ساختار: اگر انتظار JSON دارید، وجود فیلدها را تأیید کنید.
فیلترینگ محتوا: پاسخ‌ها را پیش از نمایش به کاربر، برای یافتن الگوهای مضر اسکن کنید.
راستی‌آزمایی: از یک خط لوله بازیابی (retrieval pipeline) برای بررسی ادعاها در برابر یک پایگاه دانش مشخص استفاده کنید.

حفاظ‌های سیستمی

از زیرساخت خود محافظت کنید و مطابق با استانداردها باقی بمانید.

محدودیت نرخ (Rate limiting): با تعیین سقف تعداد درخواست‌ها در هر بازه زمانی، از سوءاستفاده جلوگیری کنید.
بودجه‌بندی توکن: برای رعایت بودجه، هزینه‌های هر درخواست را محدود کنید.
مدیریت بافت (Context management): از پنجره‌های لغزان (sliding windows) یا خلاصه‌سازی برای جلوگیری از پر شدن حافظه استفاده کنید.
ثبت گزارش‌های بازرسی (Audit logging): تمام تعاملات را برای عیب‌یابی و انطباق با استانداردها ثبت کنید.
اقامت داده‌ها (Data residency): اطمینان حاصل کنید که داده‌ها در مناطق جغرافیایی مورد نظر باقی می‌مانند.

چه زمانی از آن‌ها استفاده کنیم

اگر در حال ساخت سیستم‌های کاربرمحور هستید یا با داده‌های حساس سروکار دارید، از حفاظ‌ها استفاده کنید. همچنین برای انطباق با استانداردهای GDPR، HIPAA یا SOC 2 از آن‌ها استفاده کنید.

اگر در مرحله نمونه‌سازی (prototyping) هستید یا در حال ساخت ابزارهای داخلی بدون داده‌های حساس هستید، از آن‌ها صرف‌نظر کنید.

موازنه ساده است:

حفاظ‌های بیشتر = ایمنی بالاتر، قابلیت کمتر، تأخیر (latency) بیشتر.
حفاظ‌های کمتر = ایمنی کمتر، قابلیت بیشتر، تأخیر کمتر.

تعادل مناسب را برای سیستم خاص خود بیابید.

منبع: https://dev.to/rosgluk/llm-guardrails-in-practice-what-actually-works-54ph

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi

𝗟𝗟𝗠 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗶𝗻 𝗣𝗿𝗮𝗰𝘁𝗶𝗰𝗲: 𝗪𝗵𝗮𝘁 𝗪𝗼𝗿𝗸𝘀

Continue reading

𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

تزریق پرامپت LLM و امنیت گاردریل

𝗟𝗟𝗠 𝗩𝘂𝗹𝗻𝗲𝗿𝗮𝗯𝗶𝗹𝗶𝘁𝗶𝗲𝘀 𝟭𝟬𝟭

دفاع در برابر پرامپت اینجکشن: کتابچه راهنمای حفاظتی در محیط عملیاتی

𝗟𝗟𝗠 𝗚𝗮𝘁𝗲𝘄𝗮𝘆𝘀: 𝗥𝗼𝘂𝘁𝗶𝗻𝗴, 𝗙𝗮𝗹𝗹𝗯𝗮𝗰𝗸𝘀, 𝗔𝗻𝗱 𝗦𝗲𝗺𝗮𝗻𝘁𝗶𝗰 𝗖𝗮𝗰𝗵𝗶𝗻𝗴