LLM ക്ലാസിഫിക്കേഷനായുള്ള ഇമെയിൽ ട്രിയേജ് ടാക്സോണമി
ഒരു ഇമെയിൽ ക്ലാസിഫയറിലെ ഏറ്റവും പ്രധാനപ്പെട്ട ഭാഗം അതിന്റെ മോഡലല്ല, മറിച്ച് ലേബൽ സെറ്റ് (label set) ആണ്.
മിക്ക ആളുകളും പ്രോംപ്റ്റ് ഫ്രേസിംഗിലാണ് (prompt phrasing) ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത്. എന്നാൽ യഥാർത്ഥ ജോലി ചെയ്യുന്നത് ലേബലുകളാണെന്ന് അവർ മറന്നുപോകുന്നു. ടാക്സോണമി ശരിയാണെങ്കിൽ, ഒരു സാധാരണ മോഡലിന് പോലും മികച്ച രീതിയിൽ പ്രവർത്തിക്കാൻ കഴിയും. എന്നാൽ അത് തെറ്റാണെങ്കിൽ, ഒരു മോഡലിനും നിങ്ങളെ രക്ഷിക്കാൻ കഴിയില്ല.
ഒരു വിജയകരമായ ഇമെയിൽ ടാക്സോണമി ഈ നിയമങ്ങൾ പാലിക്കണം:
- നാല് വിഭാഗങ്ങൾ ഉപയോഗിക്കുക. മൂന്ന് വിഭാഗങ്ങൾ ഉപയോഗിച്ചാൽ വിവരങ്ങൾ നഷ്ടപ്പെടാം. അഞ്ച് വിഭാഗങ്ങൾ ഉപയോഗിച്ചാൽ ആശയക്കുഴപ്പം ഉണ്ടാകാം.
- ലേബലുകളെ പ്രവർത്തനങ്ങളുമായി (actions) ബന്ധിപ്പിക്കുക. വിഷയങ്ങൾ (topics) ഉപയോഗിക്കരുത്. മറിച്ച്, മറുപടി നൽകേണ്ടതിന്റെ ഉത്തരവാദിത്തങ്ങൾ (response obligations) ഉപയോഗിക്കുക.
- ഉദാഹരണങ്ങൾ സഹിതം ലേബലുകൾ നിർവചിക്കുക. വിശേഷണങ്ങൾക്ക് (adjectives) പകരം കൃത്യമായ ഉദാഹരണങ്ങൾ ഉപയോഗിക്കുക.
- ഇൻപുട്ട് ചെറുതായി സൂക്ഷിക്കുക. അയച്ച ആൾ (sender), വിഷയം (subject), ഒരു ചെറിയ ഭാഗം (short snippet) എന്നിവ മാത്രം ഉപയോഗിക്കുക.
ഈ നാല് ഭാഗങ്ങളുള്ള ഘടന പരിഗണിക്കുക:
- URGENT: പ്രൊഡക്ഷൻ ഇൻസിഡന്റുകൾ അല്ലെങ്കിൽ എക്സിക്യൂട്ടീവ് അഭ്യർത്ഥനകൾ. 1 മണിക്കൂറിനുള്ളിൽ മറുപടി നൽകുക.
- ACTION: കോഡ് റിവ്യൂകൾ അല്ലെങ്കിൽ ഫോളോ-അപ്പുകൾ. അന്നേ ദിവസം തന്നെ മറുപടി നൽകുക.
- FYI: വിവരങ്ങൾ മാത്രം. മറുപടി ആവശ്യമില്ല.
- NOISE: ന്യൂസ്ലെറ്ററുകൾ അല്ലെങ്കിൽ മാർക്കറ്റിംഗ്. ഇത് ആർക്കൈവ് ചെയ്യുക.
ഓരോ ലേബലും ഒരു പ്രത്യേക പ്രവർത്തനവുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു. രണ്ട് ലേബലുകൾ ഒരേ പ്രവർത്തനത്തിലേക്കാണ് നയിക്കുന്നതെങ്കിൽ അവയെ യോജിപ്പിക്കുക. ഒരു ലേബൽ രണ്ട് വ്യത്യസ്ത പ്രവർത്തനങ്ങളിലേക്കാണ് നയിക്കുന്നതെങ്കിൽ അതിനെ വിഭജിക്കുക.
ഈ രീതി ഏജന്റുകളെ പ്രവചിക്കാവുന്നതാക്കുന്നു (predictable). നിരന്തരമായ മേൽനോട്ടം ഇല്ലാതെ തന്നെ നിശ്ചിത സമയക്രമത്തിൽ അവ പ്രവർത്തിപ്പിക്കാൻ നിങ്ങൾക്ക് കഴിയും. ഔട്ട്പുട്ട് കൃത്യതയുള്ളതാക്കാൻ (deterministic) ക്ലാസിഫിക്കേഷനായി 0 ടെമ്പറേച്ചർ (temperature) ഉപയോഗിക്കുക. സ്വാഭാവികമായ ശൈലി ലഭിക്കുന്നതിനായി ഡ്രാഫ്റ്റിംഗിനായി ഉയർന്ന ടെമ്പറേച്ചർ ഉപയോഗിക്കുക.
ഫ്രീ-ഫോം ടാഗുകൾ (free-form tags) ഉപയോഗിക്കരുത്. ഓരോ പുതിയ ടാഗും നിങ്ങൾ പരിശോധിക്കേണ്ട പുതിയ കോഡ് പാത്ത് (code path) സൃഷ്ടിക്കുന്നു. ഒരു ക്ലോസ്ഡ് വൊക്കാബുലറി (closed vocabulary) നിങ്ങളുടെ സിസ്റ്റം ഓഡിറ്റ് ചെയ്യാനും സ്കെയിൽ ചെയ്യാനും എളുപ്പമാക്കുന്നു.
ഈ വ്യായാമം പരീക്ഷിച്ചു നോക്കൂ: നിങ്ങളുടെ അവസാനത്തെ 50 ഇമെയിലുകൾ എടുക്കുക. ഈ നാല് വിഭാഗങ്ങൾ ഉപയോഗിച്ച് അവയെ ലേബൽ ചെയ്യുക. എവിടെയാണ് നിങ്ങൾക്ക് സംശയം തോന്നുന്നതെന്ന് ശ്രദ്ധിക്കുക. ആ വിടവുകൾ നിങ്ങളുടെ നിർവചനങ്ങൾക്ക് കൂടുതൽ ഉദാഹരണങ്ങൾ ആവശ്യമാണെന്ന് കാണിക്കുന്നു.
Source: https://dev.to/qasim157/email-triage-taxonomies-for-llm-classification-3o1j
Optional learning community: https://t.me/GyaanSetuAi