𝗘𝗺𝗮𝗶𝗹 𝗧𝗿𝗶𝗮𝗴𝗲 𝗧𝗮𝘅𝗼𝗻𝗼𝗺𝗶𝗲𝘀 𝗳𝗼𝗿 𝗟𝗟𝗠 𝗖𝗹𝗮𝘀𝘀𝗶𝗳𝗶𝗰𝗮𝘁𝗶𝗼𝗻

ಇಮೇಲ್ ವರ್ಗೀಕರಿಸುವ ಸಾಧನದ (classifier) ಅತ್ಯಂತ ಪ್ರಮುಖ ಭಾಗವು ಮಾಡೆಲ್ ಅಲ್ಲ. ಅದು ಲೇಬಲ್ ಸೆಟ್ (label set).

ಹೆಚ್ಚಿನ ಜನರು ಪ್ರಾಂಪ್ಟ್ ಫ್ರೇಸಿಂಗ್ (prompt phrasing) ಮೇಲೆ ಗಮನ ಹರಿಸುತ್ತಾರೆ. ಆದರೆ ಲೇಬಲ್‌ಗಳೇ ಹೆಚ್ಚಿನ ಕೆಲಸವನ್ನು ಮಾಡುತ್ತವೆ ಎಂಬುದನ್ನು ಅವರು ಮರೆಯುತ್ತಾರೆ. ನೀವು ಟ್ಯಾಕ್ಸಾನಮಿಯನ್ನು ಸರಿಯಾಗಿ ರೂಪಿಸಿದರೆ, ಅಗ್ಗದ ಮಾಡೆಲ್ ಕೂಡ ಚೆನ್ನಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ. ಒಂದು ವೇಳೆ ನೀವು ಅದನ್ನು ತಪ್ಪಾಗಿ ಮಾಡಿದರೆ, ಯಾವುದೇ ಮಾಡೆಲ್ ನಿಮ್ಮನ್ನು ಉಳಿಸಲಾರದು.

ಯಶಸ್ವಿ ಇಮೇಲ್ ಟ್ಯಾಕ್ಸಾನಮಿಯು ಈ ನಿಯಮಗಳನ್ನು ಅನುಸರಿಸಬೇಕು:

ಈ ನಾಲ್ಕು ಭಾಗಗಳ ರಚನೆಯನ್ನು ಪರಿಗಣಿಸಿ:

ಪ್ರತಿಯೊಂದು ಲೇಬಲ್ ಒಂದು ನಿರ್ದಿಷ್ಟ ನಡವಳಿಕೆಗೆ ಹೊಂದಿಕೆಯಾಗುತ್ತದೆ. ಎರಡು ಲೇಬಲ್‌ಗಳು ಒಂದೇ ಕ್ರಮಕ್ಕೆ ಕಾರಣವಾದರೆ, ಅವುಗಳನ್ನು ವಿಲೀನಗೊಳಿಸಿ. ಒಂದು ಲೇಬಲ್ ಎರಡು ವಿಭಿನ್ನ ಕ್ರಮಗಳಿಗೆ ಕಾರಣವಾದರೆ, ಅದನ್ನು ವಿಭಜಿಸಿ.

ಈ ವಿಧಾನವು ಏಜೆಂಟ್‌ಗಳನ್ನು (agents) ಊಹಿಸಬಹುದಾದಂತೆ ಮಾಡುತ್ತದೆ. ನೀವು ಅವುಗಳನ್ನು ನಿರಂತರ ಮೇಲ್ವಿಚಾರಣೆಯಿಲ್ಲದೆ ನಿಗದಿತ ವೇಳಾಪಟ್ಟಿಯಲ್ಲಿ ನಡೆಸಬಹುದು. ಔಟ್‌ಪುಟ್ ನಿರ್ಧಾರಿತವಾಗಿರಲು (deterministic) ವರ್ಗೀಕರಣಕ್ಕಾಗಿ 0 ಟೆಂಪರೇಚರ್ (temperature) ಬಳಸಿ. ನೈಸರ್ಗಿಕ ಬರಹಕ್ಕಾಗಿ ಡ್ರಾಫ್ಟಿಂಗ್ ಮಾಡುವಾಗ ಹೆಚ್ಚಿನ ಟೆಂಪರೇಚರ್ ಬಳಸಿ.

ಮುಕ್ತ ರೂಪದ ಟ್ಯಾಗ್‌ಗಳನ್ನು (free-form tags) ಬಳಸಬೇಡಿ. ಪ್ರತಿಯೊಂದು ಹೊಸ ಟ್ಯಾಗ್ ನೀವು ಪರೀಕ್ಷಿಸಬೇಕಾದ ಹೊಸ ಕೋಡ್ ಪಾತ್ ಅನ್ನು ಸೃಷ್ಟಿಸುತ್ತದೆ. ಮುಚ್ಚಿದ ಶಬ್ದಕೋಶವು (closed vocabulary) ನಿಮ್ಮ ವ್ಯವಸ್ಥೆಯನ್ನು ಆಡಿಟ್ ಮಾಡಲು ಮತ್ತು ಸ್ಕೇಲ್ ಮಾಡಲು ಸುಲಭವಾಗಿಸುತ್ತದೆ.

ಈ ಅಭ್ಯಾಸವನ್ನು ಪ್ರಯತ್ನಿಸಿ: ನಿಮ್ಮ ಕೊನೆಯ 50 ಇಮೇಲ್‌ಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಿ. ಈ ನಾಲ್ಕು ವರ್ಗಗಳನ್ನು ಬಳಸಿ ಅವುಗಳಿಗೆ ಲೇಬಲ್ ಮಾಡಿ. ನೀವು ಎಲ್ಲಿ ಹಿಂಜರಿಯುತ್ತೀರಿ ಎಂಬುದನ್ನು ಗಮನಿಸಿ. ಆ ಕೊರತೆಗಳು ನಿಮ್ಮ ವ್ಯಾಖ್ಯಾನಗಳಿಗೆ ಹೆಚ್ಚಿನ ಉದಾಹರಣೆಗಳ ಅಗತ್ಯವಿದೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತವೆ.

ಮೂಲ: https://dev.to/qasim157/email-triage-taxonomies-for-llm-classification-3o1j

ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi