LLM వర్గీకరణ కోసం ఈమెయిల్ ట్రైయేజ్ టాక్సోనమీలు

ఒక ఈమెయిల్ క్లాసిఫైయర్‌లో అత్యంత ముఖ్యమైన భాగం మోడల్ కాదు. అది లేబుల్ సెట్.

చాలా మంది ప్రాంప్ట్ ఫ్రేజింగ్ (prompt phrasing) పై దృష్టి పెడతారు. కానీ లేబుల్స్ మాత్రమే అసలైన పనిని చేస్తాయని వారు మర్చిపోతారు. మీరు టాక్సోనమీని సరిగ్గా రూపొందిస్తే, తక్కువ ఖర్చుతో కూడిన మోడల్ కూడా బాగా పనిచేస్తుంది. ఒకవేళ అది తప్పుగా ఉంటే, ఏ మోడల్ కూడా మిమ్మల్ని కాపాడలేదు.

విజయవంతమైన ఈమెయిల్ టాక్సోనమీ ఈ క్రింది నియమాలను పాటించాలి:

ఈ నాలుగు భాగాల నిర్మాణాన్ని పరిశీలించండి:

ప్రతి లేబుల్ ఒక నిర్దిష్ట ప్రవర్తనకు అనుసంధానించబడి ఉంటుంది. రెండు లేబుల్స్ ఒకే చర్యకు దారితీస్తే, వాటిని విలీనం చేయండి. ఒక లేబుల్ రెండు వేర్వేరు చర్యలకు దారితీస్తే, దానిని విభజించండి.

ఈ విధానం ఏజెంట్లను ఊహించదగినవిగా (predictable) చేస్తుంది. మీరు నిరంతర పర్యవేక్షణ లేకుండా వాటిని ఒక షెడ్యూల్ ప్రకారం నడపవచ్చు. అవుట్‌పుట్ డిటర్మినిస్టిక్ (deterministic) గా ఉండటానికి వర్గీకరణ కోసం 0 టెంపరేచర్‌ను ఉపయోగించండి. సహజమైన గద్యం కోసం డ్రాఫ్టింగ్ చేసేటప్పుడు అధిక టెంపరేచర్‌ను ఉపయోగించండి.

ఫ్రీ-ఫామ్ ట్యాగ్‌లను ఉపయోగించకండి. ప్రతి కొత్త ట్యాగ్ మీరు పరీక్షించాల్సిన కొత్త కోడ్ పాత్‌ను సృష్టిస్తుంది. క్లోజ్డ్ వొకాబులరీ (closed vocabulary) మీ సిస్టమ్‌ను ఆడిట్ చేయడం మరియు స్కేల్ చేయడం సులభతరం చేస్తుంది.

ఈ వ్యాయామాన్ని ప్రయత్నించండి: మీ చివరి 50 ఈమెయిల్స్‌ను తీసుకోండి. ఈ నాలుగు బకెట్ల ఉపయోగించి వాటిని లేబుల్ చేయండి. మీరు ఎక్కడ సంకోచిస్తున్నారో గమనించండి. ఆ లోపాలు మీ నిర్వచనాలకు మరిన్ని ఉదాహరణలు అవసరమని చూపుతాయి.

Source: https://dev.to/qasim157/email-triage-taxonomies-for-llm-classification-3o1j

Optional learning community: https://t.me/GyaanSetuAi