𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

📅3 hours ago⏱2 min read

Çoğu yapay zeka guardrail tavsiyesi bir satış konuşması gibi tınlıyor. Süslü diyagramlara ve kontrol listelerine odaklanıyor.

Gerçek üretim ortamı güvenliği o kadar göz alıcı değildir. LLM'lerden çok önce var olan unsurlara dayanır.

Bir Fortune 100 şirketi için yapay zeka ajanları geliştirerek iki yıl geçirdim. Bu ajanlar CI/CD hatalarını, Kubernetes olaylarını ve altyapı dokümanlarını yönetiyor.

Onları güvende tutmak için kullandığımız katmanlı yapı şöyledir:

Ajan sınırında kimlik doğrulama. Her ajan bir iş yükü kimliği (workload identity) kullanır. Asla paylaşılan kimlik bilgileri kullanmaz. IAM kapsamı, güvenlik tavanınızdır. Eğer ajanın veritabanı erişimine ihtiyacı yoksa, IAM rolü buna sahip olmamalıdır. Bu, en önemli kontrol mekanizmanızdır.
Araç izin listeleri (allow-lists). Hangi araçları bir ajanın görebileceğine platform karar verir. Kod arama ajanı bir e-posta aracına sahip olmamalıdır. Bunun için statik yapılandırmalar kullanıyoruz. Asla dinamik araç kaydı kullanmıyoruz.
Ağ çıkış (egress) kontrolleri. Ajanlar yalnızca izin verilen uç noktalara (endpoints) erişebilir. DNS filtreleme ve bir çıkış proxy'si kullanıyoruz. Bu, model halüsinasyonlarının yanlış URL'lere gitmesini engeller.
Sırların (secrets) izolasyonu. Ajanlar ham sırları asla görmez. Araç çağrıları sırasında enjekte edilen kısa ömürlü oturum jetonları (session tokens) kullanıyoruz. Sırları asla bir prompt'a koymayın. Bir prompt içindeki her şey günlüğe kaydedilebilir veya tekrar oynatılabilir.
Tam denetim izleri (audit trails). Her model çağrısını ve her araç çağrısını günlüğe kaydetmelisiniz. Bu; girdileri, çıktıları, araç argümanlarını ve kullanıcı kimliğini içerir. Bir olay sırasında neyin yanlış gittiğini anlamak için buna ihtiyacınız vardır.
İnsan onayı. Resmi bir kayıt sistemini (system of record) değiştiren herhangi bir işlem için platform duraklamalıdır. Bir insan işlemi onaylamalıdır. Bu, sizin güvenlik ağınızdır.

Bu yaygın hatalardan kaçının:

Prompt düzeyinde talimatlar. Bir modele "asla X yapma" demek güvenlik değildir. Bir kullanıcı modeli kandırabilir. Kontrolü IAM veya araç katmanına taşıyın.
Genel PII (Kişisel Veri) filtreleri. Bunların hata oranları yüksektir. Veri erişimini IAM aracılığıyla sınırlamak, ajanın hassas bilgileri asla görmemesini sağlamak açısından daha iyidir.
Guardrail modelleri. Birinciyi puanlamak için ikinci bir LLM kullanmak gecikmeye (latency) neden olur. Bu gerçek bir güvenlik kontrolü değildir; sadece bir model topluluğudur (ensemble).

Zor yoldan öğrendiğim dersler:

Promptlardan önce IAM'i düzeltin. IAM rollerini sıkılaştırmam gerekirken promptları optimize etmekle vakit kaybettim. Kontrolleri yığının (stack) mümkün olduğunca alt katmanlarına taşıyın.
Denetim izlerinizi (audit trail) kapsamlı tutun. Sadece istemi (prompt) ve cevabı kaydetmek yeterli değildir. Ara araç çağrılarına ve argümanlara ihtiyacınız vardır. Erken aşamada loglamak ucuzdur ancak sonradan düzeltmek pahalıya mal olur.
Ajan iletişimini sınırlayın. Çoklu ajan sistemlerinde, ajandan ajana yapılan çağrılar için kesin bir sınır belirleyin. Bu, zincirleme hataları önler.

Ölçeklenebilir yapay zeka güvenliği bir model problemi değildir. Bu bir platform problemidir. Ajanlarınıza, diğer tüm üretim sistemlerinde olduğu gibi aynı operasyonel disiplinle yaklaşın.

Kaynak: https://dev.to/srujan_t04/-guardrails-for-enterprise-ai-agents-whats-actually-load-bearing-in-production-2dhd

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi

𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

Continue reading

𝗧𝗵𝗲 𝗜𝗻𝗳𝗿𝗮𝘀𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲 𝗥𝘂𝗹𝗲 𝗙𝗼𝗿 𝗦𝗮𝗳𝗲 𝗔𝗜

𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗚𝗼𝘃𝗲𝗿𝗻𝗮𝗻𝗰𝗲 𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗚𝗼𝘃𝗲𝗿𝗻𝗮𝗻𝗰𝗲 𝗼𝗻 𝗔𝗪𝗦: 𝗪𝗵𝗮𝘁 𝗟𝗲𝗮𝗱𝗲𝗿𝘀 𝗡𝗲𝗲𝗱 𝘁𝗼 𝗞𝗻𝗼𝘄

𝗔𝗜 𝗚𝗮𝘁𝗲𝘄𝗮𝘆: 𝗧𝗵𝗲 𝗖𝗲𝗻𝘁𝗿𝗮𝗹 𝗡𝗲𝗿𝘃𝗼𝘂𝘀 𝗦𝘆𝘀𝘁𝗲𝗺 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗟𝗟𝗠𝘀

𝗪𝗵𝘆 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗙𝗮𝗶𝗹 𝗶𝗻 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻