𝗘𝗺𝗮𝗶𝗹 𝗧𝗿𝗶𝗮𝗴𝗲 𝗧𝗮𝘅𝗼𝗻𝗼𝗺𝗶𝗲𝘀 𝗳𝗼𝗿 𝗟𝗟𝗠 𝗖𝗹𝗮𝘀𝘀𝗶𝗳𝗶𝗰𝗮𝘁𝗶𝗼𝗻

📅3 hours ago⏱1 min read

LLM ക്ലാസിഫിക്കേഷനായുള്ള ഇമെയിൽ ട്രിയേജ് ടാക്സോണമി

ഒരു ഇമെയിൽ ക്ലാസിഫയറിലെ ഏറ്റവും പ്രധാനപ്പെട്ട ഭാഗം അതിന്റെ മോഡലല്ല, മറിച്ച് ലേബൽ സെറ്റ് (label set) ആണ്.

മിക്ക ആളുകളും പ്രോംപ്റ്റ് ഫ്രേസിംഗിലാണ് (prompt phrasing) ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത്. എന്നാൽ യഥാർത്ഥ ജോലി ചെയ്യുന്നത് ലേബലുകളാണെന്ന് അവർ മറന്നുപോകുന്നു. ടാക്സോണമി ശരിയാണെങ്കിൽ, ഒരു സാധാരണ മോഡലിന് പോലും മികച്ച രീതിയിൽ പ്രവർത്തിക്കാൻ കഴിയും. എന്നാൽ അത് തെറ്റാണെങ്കിൽ, ഒരു മോഡലിനും നിങ്ങളെ രക്ഷിക്കാൻ കഴിയില്ല.

ഒരു വിജയകരമായ ഇമെയിൽ ടാക്സോണമി ഈ നിയമങ്ങൾ പാലിക്കണം:

നാല് വിഭാഗങ്ങൾ ഉപയോഗിക്കുക. മൂന്ന് വിഭാഗങ്ങൾ ഉപയോഗിച്ചാൽ വിവരങ്ങൾ നഷ്ടപ്പെടാം. അഞ്ച് വിഭാഗങ്ങൾ ഉപയോഗിച്ചാൽ ആശയക്കുഴപ്പം ഉണ്ടാകാം.
ലേബലുകളെ പ്രവർത്തനങ്ങളുമായി (actions) ബന്ധിപ്പിക്കുക. വിഷയങ്ങൾ (topics) ഉപയോഗിക്കരുത്. മറിച്ച്, മറുപടി നൽകേണ്ടതിന്റെ ഉത്തരവാദിത്തങ്ങൾ (response obligations) ഉപയോഗിക്കുക.
ഉദാഹരണങ്ങൾ സഹിതം ലേബലുകൾ നിർവചിക്കുക. വിശേഷണങ്ങൾക്ക് (adjectives) പകരം കൃത്യമായ ഉദാഹരണങ്ങൾ ഉപയോഗിക്കുക.
ഇൻപുട്ട് ചെറുതായി സൂക്ഷിക്കുക. അയച്ച ആൾ (sender), വിഷയം (subject), ഒരു ചെറിയ ഭാഗം (short snippet) എന്നിവ മാത്രം ഉപയോഗിക്കുക.

ഈ നാല് ഭാഗങ്ങളുള്ള ഘടന പരിഗണിക്കുക:

URGENT: പ്രൊഡക്ഷൻ ഇൻസിഡന്റുകൾ അല്ലെങ്കിൽ എക്സിക്യൂട്ടീവ് അഭ്യർത്ഥനകൾ. 1 മണിക്കൂറിനുള്ളിൽ മറുപടി നൽകുക.
ACTION: കോഡ് റിവ്യൂകൾ അല്ലെങ്കിൽ ഫോളോ-അപ്പുകൾ. അന്നേ ദിവസം തന്നെ മറുപടി നൽകുക.
FYI: വിവരങ്ങൾ മാത്രം. മറുപടി ആവശ്യമില്ല.
NOISE: ന്യൂസ്‌ലെറ്ററുകൾ അല്ലെങ്കിൽ മാർക്കറ്റിംഗ്. ഇത് ആർക്കൈവ് ചെയ്യുക.

ഓരോ ലേബലും ഒരു പ്രത്യേക പ്രവർത്തനവുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു. രണ്ട് ലേബലുകൾ ഒരേ പ്രവർത്തനത്തിലേക്കാണ് നയിക്കുന്നതെങ്കിൽ അവയെ യോജിപ്പിക്കുക. ഒരു ലേബൽ രണ്ട് വ്യത്യസ്ത പ്രവർത്തനങ്ങളിലേക്കാണ് നയിക്കുന്നതെങ്കിൽ അതിനെ വിഭജിക്കുക.

ഈ രീതി ഏജന്റുകളെ പ്രവചിക്കാവുന്നതാക്കുന്നു (predictable). നിരന്തരമായ മേൽനോട്ടം ഇല്ലാതെ തന്നെ നിശ്ചിത സമയക്രമത്തിൽ അവ പ്രവർത്തിപ്പിക്കാൻ നിങ്ങൾക്ക് കഴിയും. ഔട്ട്‌പുട്ട് കൃത്യതയുള്ളതാക്കാൻ (deterministic) ക്ലാസിഫിക്കേഷനായി 0 ടെമ്പറേച്ചർ (temperature) ഉപയോഗിക്കുക. സ്വാഭാവികമായ ശൈലി ലഭിക്കുന്നതിനായി ഡ്രാഫ്റ്റിംഗിനായി ഉയർന്ന ടെമ്പറേച്ചർ ഉപയോഗിക്കുക.

ഫ്രീ-ഫോം ടാഗുകൾ (free-form tags) ഉപയോഗിക്കരുത്. ഓരോ പുതിയ ടാഗും നിങ്ങൾ പരിശോധിക്കേണ്ട പുതിയ കോഡ് പാത്ത് (code path) സൃഷ്ടിക്കുന്നു. ഒരു ക്ലോസ്ഡ് വൊക്കാബുലറി (closed vocabulary) നിങ്ങളുടെ സിസ്റ്റം ഓഡിറ്റ് ചെയ്യാനും സ്കെയിൽ ചെയ്യാനും എളുപ്പമാക്കുന്നു.

ഈ വ്യായാമം പരീക്ഷിച്ചു നോക്കൂ: നിങ്ങളുടെ അവസാനത്തെ 50 ഇമെയിലുകൾ എടുക്കുക. ഈ നാല് വിഭാഗങ്ങൾ ഉപയോഗിച്ച് അവയെ ലേബൽ ചെയ്യുക. എവിടെയാണ് നിങ്ങൾക്ക് സംശയം തോന്നുന്നതെന്ന് ശ്രദ്ധിക്കുക. ആ വിടവുകൾ നിങ്ങളുടെ നിർവചനങ്ങൾക്ക് കൂടുതൽ ഉദാഹരണങ്ങൾ ആവശ്യമാണെന്ന് കാണിക്കുന്നു.

Source: https://dev.to/qasim157/email-triage-taxonomies-for-llm-classification-3o1j

Optional learning community: https://t.me/GyaanSetuAi

𝗘𝗺𝗮𝗶𝗹 𝗧𝗿𝗶𝗮𝗴𝗲 𝗧𝗮𝘅𝗼𝗻𝗼𝗺𝗶𝗲𝘀 𝗳𝗼𝗿 𝗟𝗟𝗠 𝗖𝗹𝗮𝘀𝘀𝗶𝗳𝗶𝗰𝗮𝘁𝗶𝗼𝗻

Continue reading

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

പ്രൊഫഷണലുകൾക്കായുള്ള ഇമെയിൽ എഴുതാനുള്ള ടിപ്‌സുകൾ

കാര്യക്ഷമമായ LLM സർവിംഗിലേക്ക്

𝗗𝗶𝘀𝗽𝗼𝘀𝗮𝗯𝗹𝗲 𝗘𝗺𝗮𝗶𝗹 𝘃𝘀 𝗔𝗹𝗶𝗮𝘀𝗲𝘀 𝘃𝘀 𝗥𝗲𝗮𝗹 𝗘𝗺𝗮𝗶𝗹

𝗖𝗼𝗺𝗺𝗼𝗻 𝗣𝗶𝘁𝗳𝗮𝗹𝗹𝘀 𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗘𝗺𝗮𝗶𝗹 𝗔𝗴𝗲𝗻𝘁𝘀