𝗘𝗺𝗮𝗶𝗹 𝗧𝗿𝗶𝗮𝗴𝗲 𝗧𝗮𝘅𝗼𝗻𝗼𝗺𝗶𝗲𝘀 𝗳𝗼𝗿 𝗟𝗟𝗠 𝗖𝗹𝗮𝘀𝘀𝗶𝗳𝗶𝗰𝗮𝘁𝗶𝗼𝗻

একটি ইমেল ক্লাসিফায়ারের সবচেয়ে গুরুত্বপূর্ণ অংশ মডেল নয়, বরং লেবেল সেট (label set)।

বেশিরভাগ মানুষ প্রম্পট সাজানোর (prompt phrasing) দিকে মনোযোগ দেন। তারা ভুলে যান যে আসল কাজ করে লেবেলগুলো। আপনি যদি ট্যাক্সোনমি সঠিকভাবে করতে পারেন, তবে একটি সস্তা মডেলও ভালো কাজ করবে। আর যদি এটি ভুল হয়, তবে কোনো মডেলই আপনাকে বাঁচাতে পারবে না।

একটি সফল ইমেল ট্যাক্সোনমির জন্য এই নিয়মগুলো অনুসরণ করা উচিত:

এই চার-স্তর বিশিষ্ট কাঠামোটি বিবেচনা করুন:

প্রতিটি লেবেল একটি নির্দিষ্ট আচরণের সাথে যুক্ত। যদি দুটি লেবেল একই কাজের দিকে পরিচালিত করে, তবে তাদের একত্রিত করুন। আর যদি একটি লেবেল দুটি ভিন্ন কাজের দিকে পরিচালিত করে, তবে সেটিকে ভাগ করে নিন।

এই পদ্ধতিটি এজেন্টদের অনুমানযোগ্য (predictable) করে তোলে। আপনি কোনো সার্বক্ষণিক তদারকি ছাড়াই একটি নির্দিষ্ট সময়সূচী অনুযায়ী তাদের চালাতে পারেন। আউটপুট যাতে ডিটারমিনিস্টিক (deterministic) হয় তা নিশ্চিত করতে ক্লাসিফিকেশনের জন্য ০ (zero) টেম্পারেচার ব্যবহার করুন। স্বাভাবিক গদ্য বা লেখা পেতে ড্রাফটিংয়ের জন্য উচ্চতর টেম্পারেচার ব্যবহার করুন।

ফ্রি-ফর্ম ট্যাগ ব্যবহার করবেন না। প্রতিটি নতুন ট্যাগ একটি নতুন কোড পাথ (code path) তৈরি করে যা আপনাকে পরীক্ষা করতে হবে। একটি সীমাবদ্ধ শব্দভাণ্ডার (closed vocabulary) আপনার সিস্টেমকে অডিট এবং স্কেল করা সহজ করে তোলে।

এই অনুশীলনটি চেষ্টা করে দেখুন: আপনার শেষ ৫০টি ইমেল নিন। এই চারটি বাকেটের (buckets) মাধ্যমে সেগুলোকে লেবেল করুন। কোথায় আপনার দ্বিধা হচ্ছে তা নোট করুন। সেই ফাঁকগুলোই নির্দেশ করবে যেখানে আপনার সংজ্ঞায় আরও উদাহরণের প্রয়োজন।

Source: https://dev.to/qasim157/email-triage-taxonomies-for-llm-classification-3o1j

Optional learning community: https://t.me/GyaanSetuAi