LLM ক্লাসিফিকেশনের জন্য ইমেল ট্রায়াজ ট্যাক্সোনমি

📅3 hours ago⏱1 min read

𝗘𝗺𝗮𝗶𝗹 𝗧𝗿𝗶𝗮𝗴𝗲 𝗧𝗮𝘅𝗼𝗻𝗼𝗺𝗶𝗲𝘀 𝗳𝗼𝗿 𝗟𝗟𝗠 𝗖𝗹𝗮𝘀𝘀𝗶𝗳𝗶𝗰𝗮𝘁𝗶𝗼𝗻

একটি ইমেল ক্লাসিফায়ারের সবচেয়ে গুরুত্বপূর্ণ অংশ মডেল নয়, বরং লেবেল সেট (label set)।

বেশিরভাগ মানুষ প্রম্পট সাজানোর (prompt phrasing) দিকে মনোযোগ দেন। তারা ভুলে যান যে আসল কাজ করে লেবেলগুলো। আপনি যদি ট্যাক্সোনমি সঠিকভাবে করতে পারেন, তবে একটি সস্তা মডেলও ভালো কাজ করবে। আর যদি এটি ভুল হয়, তবে কোনো মডেলই আপনাকে বাঁচাতে পারবে না।

একটি সফল ইমেল ট্যাক্সোনমির জন্য এই নিয়মগুলো অনুসরণ করা উচিত:

চারটি ক্যাটাগরি ব্যবহার করুন। তিনটি ক্যাটাগরি ব্যবহার করলে বিস্তারিত তথ্য হারিয়ে যেতে পারে। পাঁচটি ক্যাটাগরি বিভ্রান্তি সৃষ্টি করতে পারে।
লেবেলগুলোকে কাজের (actions) সাথে যুক্ত করুন। বিষয়বস্তু (topics) ব্যবহার করবেন না। পরিবর্তে উত্তরের বাধ্যবাধকতা (response obligations) ব্যবহার করুন।
উদাহরণ দিয়ে লেবেলগুলো সংজ্ঞায়িত করুন। বিশেষণ (adjectives) ব্যবহার না করে সুনির্দিষ্ট উদাহরণ ব্যবহার করুন।
ইনপুট ছোট রাখুন। প্রেরক, বিষয় (subject) এবং একটি ছোট অংশ (snippet) ব্যবহার করুন।

এই চার-স্তর বিশিষ্ট কাঠামোটি বিবেচনা করুন:

URGENT: প্রোডাকশন ইনসিডেন্ট বা এক্সিকিউটিভ রিকোয়েস্ট। ১ ঘণ্টার মধ্যে উত্তর দিন।
ACTION: কোড রিভিউ বা ফলো-আপ। একই দিনে উত্তর দিন।
FYI: শুধুমাত্র তথ্যের জন্য। কোনো উত্তরের প্রয়োজন নেই।
NOISE: নিউজলেটার বা মার্কেটিং। এটি আর্কাইভ করে রাখুন।

প্রতিটি লেবেল একটি নির্দিষ্ট আচরণের সাথে যুক্ত। যদি দুটি লেবেল একই কাজের দিকে পরিচালিত করে, তবে তাদের একত্রিত করুন। আর যদি একটি লেবেল দুটি ভিন্ন কাজের দিকে পরিচালিত করে, তবে সেটিকে ভাগ করে নিন।

এই পদ্ধতিটি এজেন্টদের অনুমানযোগ্য (predictable) করে তোলে। আপনি কোনো সার্বক্ষণিক তদারকি ছাড়াই একটি নির্দিষ্ট সময়সূচী অনুযায়ী তাদের চালাতে পারেন। আউটপুট যাতে ডিটারমিনিস্টিক (deterministic) হয় তা নিশ্চিত করতে ক্লাসিফিকেশনের জন্য ০ (zero) টেম্পারেচার ব্যবহার করুন। স্বাভাবিক গদ্য বা লেখা পেতে ড্রাফটিংয়ের জন্য উচ্চতর টেম্পারেচার ব্যবহার করুন।

ফ্রি-ফর্ম ট্যাগ ব্যবহার করবেন না। প্রতিটি নতুন ট্যাগ একটি নতুন কোড পাথ (code path) তৈরি করে যা আপনাকে পরীক্ষা করতে হবে। একটি সীমাবদ্ধ শব্দভাণ্ডার (closed vocabulary) আপনার সিস্টেমকে অডিট এবং স্কেল করা সহজ করে তোলে।

এই অনুশীলনটি চেষ্টা করে দেখুন: আপনার শেষ ৫০টি ইমেল নিন। এই চারটি বাকেটের (buckets) মাধ্যমে সেগুলোকে লেবেল করুন। কোথায় আপনার দ্বিধা হচ্ছে তা নোট করুন। সেই ফাঁকগুলোই নির্দেশ করবে যেখানে আপনার সংজ্ঞায় আরও উদাহরণের প্রয়োজন।

Source: https://dev.to/qasim157/email-triage-taxonomies-for-llm-classification-3o1j

Optional learning community: https://t.me/GyaanSetuAi

LLM ক্লাসিফিকেশনের জন্য ইমেল ট্রায়াজ ট্যাক্সোনমি

Continue reading

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

পেশাদারদের জন্য ইমেল লেখার টিপস

দক্ষ LLM সার্ভিংয়ের দিকে

ডিসপোজেবল ইমেল বনাম এলিয়াসেস বনাম রিয়েল ইমেল

ইমেইল এজেন্ট তৈরির ক্ষেত্রে সাধারণ ভুলসমূহ