LLM ക്ലാസിഫിക്കേഷനായുള്ള ഇമെയിൽ ട്രിയേജ് ടാക്സോണമി

ഒരു ഇമെയിൽ ക്ലാസിഫയറിലെ ഏറ്റവും പ്രധാനപ്പെട്ട ഭാഗം അതിന്റെ മോഡലല്ല, മറിച്ച് ലേബൽ സെറ്റ് (label set) ആണ്.

മിക്ക ആളുകളും പ്രോംപ്റ്റ് ഫ്രേസിംഗിലാണ് (prompt phrasing) ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത്. എന്നാൽ യഥാർത്ഥ ജോലി ചെയ്യുന്നത് ലേബലുകളാണെന്ന് അവർ മറന്നുപോകുന്നു. ടാക്സോണമി ശരിയാണെങ്കിൽ, ഒരു സാധാരണ മോഡലിന് പോലും മികച്ച രീതിയിൽ പ്രവർത്തിക്കാൻ കഴിയും. എന്നാൽ അത് തെറ്റാണെങ്കിൽ, ഒരു മോഡലിനും നിങ്ങളെ രക്ഷിക്കാൻ കഴിയില്ല.

ഒരു വിജയകരമായ ഇമെയിൽ ടാക്സോണമി ഈ നിയമങ്ങൾ പാലിക്കണം:

ഈ നാല് ഭാഗങ്ങളുള്ള ഘടന പരിഗണിക്കുക:

ഓരോ ലേബലും ഒരു പ്രത്യേക പ്രവർത്തനവുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു. രണ്ട് ലേബലുകൾ ഒരേ പ്രവർത്തനത്തിലേക്കാണ് നയിക്കുന്നതെങ്കിൽ അവയെ യോജിപ്പിക്കുക. ഒരു ലേബൽ രണ്ട് വ്യത്യസ്ത പ്രവർത്തനങ്ങളിലേക്കാണ് നയിക്കുന്നതെങ്കിൽ അതിനെ വിഭജിക്കുക.

ഈ രീതി ഏജന്റുകളെ പ്രവചിക്കാവുന്നതാക്കുന്നു (predictable). നിരന്തരമായ മേൽനോട്ടം ഇല്ലാതെ തന്നെ നിശ്ചിത സമയക്രമത്തിൽ അവ പ്രവർത്തിപ്പിക്കാൻ നിങ്ങൾക്ക് കഴിയും. ഔട്ട്‌പുട്ട് കൃത്യതയുള്ളതാക്കാൻ (deterministic) ക്ലാസിഫിക്കേഷനായി 0 ടെമ്പറേച്ചർ (temperature) ഉപയോഗിക്കുക. സ്വാഭാവികമായ ശൈലി ലഭിക്കുന്നതിനായി ഡ്രാഫ്റ്റിംഗിനായി ഉയർന്ന ടെമ്പറേച്ചർ ഉപയോഗിക്കുക.

ഫ്രീ-ഫോം ടാഗുകൾ (free-form tags) ഉപയോഗിക്കരുത്. ഓരോ പുതിയ ടാഗും നിങ്ങൾ പരിശോധിക്കേണ്ട പുതിയ കോഡ് പാത്ത് (code path) സൃഷ്ടിക്കുന്നു. ഒരു ക്ലോസ്ഡ് വൊക്കാബുലറി (closed vocabulary) നിങ്ങളുടെ സിസ്റ്റം ഓഡിറ്റ് ചെയ്യാനും സ്കെയിൽ ചെയ്യാനും എളുപ്പമാക്കുന്നു.

ഈ വ്യായാമം പരീക്ഷിച്ചു നോക്കൂ: നിങ്ങളുടെ അവസാനത്തെ 50 ഇമെയിലുകൾ എടുക്കുക. ഈ നാല് വിഭാഗങ്ങൾ ഉപയോഗിച്ച് അവയെ ലേബൽ ചെയ്യുക. എവിടെയാണ് നിങ്ങൾക്ക് സംശയം തോന്നുന്നതെന്ന് ശ്രദ്ധിക്കുക. ആ വിടവുകൾ നിങ്ങളുടെ നിർവചനങ്ങൾക്ക് കൂടുതൽ ഉദാഹരണങ്ങൾ ആവശ്യമാണെന്ന് കാണിക്കുന്നു.

Source: https://dev.to/qasim157/email-triage-taxonomies-for-llm-classification-3o1j

Optional learning community: https://t.me/GyaanSetuAi