𝗟𝗟𝗠 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗶𝗻 𝗣𝗿𝗮𝗰𝘁𝗶𝗰𝗲: 𝗪𝗵𝗮𝘁 𝗪𝗼𝗿𝗸𝘀

Translated for your language. Read the original.

AI-assisted draft.

२ दिवसांपूर्वी1min read

LLMs अनपेक्षित असतात. ते भ्रम निर्माण करतात (hallucinate). ते डेटा लीक करतात. ते हानिकारक मजकूर तयार करतात.

Guardrails मॉडेलला नियंत्रित करत नाहीत. ते जोखमीला (risk) नियंत्रित करतात.

कोणते guardrails महत्त्वाचे आहेत आणि कोणते केवळ गोंधळ (noise) आहेत, याचा निर्णय तुम्हाला घ्यावा लागेल.

Input Guardrails

चुकीच्या इनपुटमुळे चुकीचे आउटपुट मिळते. यामुळे prompt injection देखील होऊ शकते.

पॅटर्न सॅनिटाइझ करा: "मागील सूचनांकडे दुर्लक्ष करा" (ignore previous instructions) सारख्या सूचना सुरुवातीलाच काढून टाका.
लांबीच्या मर्यादा: टोकनचा अपव्यय आणि टाइमआउट टाळण्यासाठी कमाल अक्षरांची मर्यादा निश्चित करा.
कंटेंट फिल्टरिंग: हिंसाचार किंवा द्वेषयुक्त भाषण (hate speech) यांसारख्या विषयांना ब्लॉक करा. अधिक अचूकतेसाठी साध्या स्ट्रिंग मॅचिंगऐवजी लहान क्लासिफायर मॉडेलचा वापर करा.

Output Guardrails

मॉडेल काय परत पाठवत आहे, हे तुम्ही तपासले पाहिजे.

स्ट्रक्चर व्हॅलिडेशन: जर तुम्हाला JSON अपेक्षित असेल, तर फील्ड्स अस्तित्वात असल्याची खात्री करा.
कंटेंट फिल्टरिंग: वापरकर्त्याला दिसण्यापूर्वी प्रतिसादांमध्ये हानिकारक पॅटर्न आहेत का ते तपासा.
फॅक्ट चेकिंग: माहितीच्या ज्ञात डेटाबेसशी (knowledge base) दाव्यांची पडताळणी करण्यासाठी रिट्रिव्हल पाईपलाईनचा वापर करा.

System Guardrails

तुमच्या इन्फ्रास्ट्रक्चरचे संरक्षण करा आणि नियमांचे पालन (compliance) करा.

रेट लिमिटिंग: एका ठराविक वेळेत येणाऱ्या विनंत्यांवर (requests) मर्यादा आणून गैरवापर रोखा.
टोकन बजेटिंग: बजेटमध्ये राहण्यासाठी प्रति-विनंती खर्च मर्यादित ठेवा.
कॉन्टेक्स्ट मॅनेजमेंट: मेमरी ओव्हरफ्लो टाळण्यासाठी स्लाइडिंग विंडोज किंवा समरायझेशनचा वापर करा.
ऑडिट लॉगिंग: डीबगिंग आणि अनुपालनासाठी (compliance) सर्व संवादांची नोंद (log) ठेवा.
डेटा रेसिडेन्सी: डेटा आवश्यक भौगोलिक क्षेत्रांमध्येच राहील याची खात्री करा.

त्यांचा वापर कधी करावा

जर तुम्ही वापरकर्त्यांसाठी थेट प्रणाली (user-facing systems) तयार करत असाल किंवा संवेदनशील डेटा हाताळत असाल, तर guardrails वापरा. GDPR, HIPAA किंवा SOC 2 अनुपालनासाठी त्यांचा वापर करा.

जर तुम्ही प्रोटोटाइपिंग करत असाल किंवा कोणताही संवेदनशील डेटा नसलेली अंतर्गत साधने (internal tools) तयार करत असाल, तर ते टाळू शकता.

यामधील तडजोड (tradeoff) सोपी आहे:

अधिक guardrails = अधिक सुरक्षा, कमी क्षमता, जास्त लॅटन्सी (latency).
कमी guardrails = कमी सुरक्षा, अधिक क्षमता, कमी लॅटन्सी (latency).

तुमच्या विशिष्ट प्रणालीसाठी योग्य संतुलन शोधा.

स्रोत: https://dev.to/rosgluk/llm-guardrails-in-practice-what-actually-works-54ph

ऐच्छिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi

𝗟𝗟𝗠 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗶𝗻 𝗣𝗿𝗮𝗰𝘁𝗶𝗰𝗲: 𝗪𝗵𝗮𝘁 𝗪𝗼𝗿𝗸𝘀

Continue reading

𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

LLM प्रॉम्प्ट इंजेक्शन आणि गार्डरेल सुरक्षा

LLM असुरक्षितता १०१

प्रॉम्प्ट इंजेक्शन संरक्षण: प्रोडक्शन गार्डरेल्स प्लेबुक

LLM गेटवे: राउटिंग, फॉलबॅक्स आणि सिमेंटिक कॅशिंग