𝗘𝗺𝗮𝗶𝗹 𝗧𝗿𝗶𝗮𝗴𝗲 𝗧𝗮𝘅𝗼𝗻𝗼𝗺𝗶𝗲𝘀 𝗳𝗼𝗿 𝗟𝗟𝗠 𝗖𝗹𝗮𝘀𝘀𝗶𝗳𝗶𝗰𝗮𝘁𝗶𝗼𝗻
ईमेल क्लासिफायरचा (email classifier) सर्वात महत्त्वाचा भाग मॉडेल नसून, लेबल्सचा संच (label set) आहे.
बहुतेक लोक प्रॉम्प्टच्या शब्दरचनेवर (prompt phrasing) लक्ष केंद्रित करतात. ते हे विसरतात की खरे काम लेबल्स करतात. जर तुमची टॅक्सोनॉमी योग्य असेल, तर एक स्वस्त मॉडेल देखील चांगले काम करते. जर ती चुकीची असेल, तर कोणतेही मॉडेल तुम्हाला वाचवू शकत नाही.
यशस्वी ईमेल टॅक्सोनॉमीसाठी खालील नियमांचे पालन केले पाहिजे:
- चार श्रेणींचा (categories) वापर करा. तीन श्रेणी असल्यास तपशील कमी पडतात. पाच श्रेणी असल्यास गोंधळ निर्माण होतो.
- लेबल्सना कृतींशी (actions) जोडा. विषयांचा (topics) वापर करू नका. प्रतिसादाची जबाबदारी (response obligations) वापरा.
- उदाहरणांसह लेबल्स परिभाषित करा. विशेषणांऐवजी (adjectives) ठोस उदाहरणे वापरा.
- इनपुट लहान ठेवा. पाठवणारा (sender), विषय (subject) आणि एक छोटा उतारा (snippet) वापरा.
या चार भागांच्या संरचनेचा विचार करा:
- URGENT: प्रोडक्शन इन्सिडेंट्स किंवा एक्झिक्युटिव्ह विनंत्या. १ तासाच्या आत उत्तर द्या.
- ACTION: कोड रिव्ह्यू किंवा फॉलो-अप्स. त्याच दिवशी उत्तर द्या.
- FYI: फक्त माहिती. प्रतिसादाची गरज नाही.
- NOISE: न्यूजलेटर्स किंवा मार्केटिंग. ते आर्काइव्ह करा.
प्रत्येक लेबल एका विशिष्ट वर्तनाशी (behavior) जोडलेले असते. जर दोन लेबल्स एकाच कृतीकडे नेत असतील, तर त्यांना एकत्र करा. जर एक लेबल दोन वेगवेगळ्या कृतींकडे नेत असेल, तर त्याचे विभाजन करा.
हा दृष्टिकोन एजंट्सना (agents) अधिक अंदाज येण्यासारखे (predictable) बनवतो. तुम्ही सतत देखरेखीशिवाय त्यांना एका ठराविक वेळापत्रकानुसार चालवू शकता. आउटपुट डिटरमिनिस्टिक (deterministic) असल्याची खात्री करण्यासाठी वर्गीकरणासाठी 0 तापमान (temperature) वापरा. नैसर्गिक लेखन मिळवण्यासाठी ड्राफ्टिंगसाठी उच्च तापमान वापरा.
फ्री-फॉर्म टॅग्सचा वापर करू नका. प्रत्येक नवीन टॅग एक नवीन कोड पाथ (code path) तयार करतो ज्याची तुम्हाला चाचणी करावी लागेल. मर्यादित शब्दसंग्रह (closed vocabulary) तुमची प्रणाली ऑडिट आणि स्केल करणे सोपे बनवतो.
हा सराव करून पहा: तुमचे शेवटचे ५० ईमेल घ्या. या चार गटांचा (buckets) वापर करून त्यांना लेबल करा. तुम्हाला कुठे संभ्रम वाटतोय ते नोंदवा. त्या त्रुटी दर्शवतात की तुमच्या व्याख्यांना अधिक उदाहरणांची गरज आहे.
Source: https://dev.to/qasim157/email-triage-taxonomies-for-llm-classification-3o1j
Optional learning community: https://t.me/GyaanSetuAi