আপনার টিমের এই সপ্তাহে আরও উন্নত কোনো AI মডেলের প্রয়োজন নেই
আপনার টিমের নতুন কোনো AI মডেলের প্রয়োজন নেই। তাদের প্রয়োজন আরও উন্নত ওয়ার্কফ্লো (workflows)।
সর্বশেষ মডেল খোঁজা বন্ধ করুন। আপনার এক্সিকিউশন ইঞ্জিনিয়ারিং শুরু করুন। বেশিরভাগ টিমই একই সমস্যার সম্মুখীন হয়। এজেন্ট লুপগুলো (agent loops) টাস্ক চলাকালীন মাঝপথে থেমে যায়। অ্যাপ্রুভাল প্রম্পটগুলো মানুষকে বিভ্রান্ত করে। রিট্রাই করার সময় কনটেক্সট চেইনগুলো (context chains) ভেঙে যায়। অটোমেশন তার স্টেট (state) হারিয়ে ফেললে মানুষ ভুলগুলো সংশোধন করতে ঘণ্টার পর ঘণ্টা ব্যয় করে।
সমস্যাটি এখন আর বুদ্ধিমত্তার নয়। সমস্যাটি হলো এক্সিকিউশন বা বাস্তবায়ন।
আমরা এখন 'অরকেস্ট্রেশন ট্যাক্স' (orchestration tax)-এর যুগে প্রবেশ করছি। আপনি যদি এর জন্য পরিকল্পনা না করেন, তবে সিস্টেম আউটটেজ এবং নিঃশব্দ ব্যর্থতার (silent failures) মাধ্যমে আপনাকে এর মূল্য দিতে হবে। যখন ইঞ্জিনিয়ারদের গভীর রাতে বটদের দেখাশোনা করতে হয়, তখন আপনি এই মূল্য দিচ্ছেন।
AI-এর আউটপুট খুব কমই চূড়ান্ত পণ্য হয়। এটি একটি বৃহত্তর সিস্টেমের মধ্যবর্তী ধাপ মাত্র। এটি টিকিট ট্রায়াজ (ticket triage), PR ড্রাফটিং এবং টেস্ট জেনারেশনে সাহায্য করে।
আপনাকে এই প্রশ্নগুলোর উত্তর দিতে হবে:
- টাইমআউটের পর কি টাস্কটি পুনরায় শুরু করা সম্ভব?
- কোনো পরিবর্তন কে অ্যাপ্রুভ করেছে তা কি আমরা অডিট করতে পারি?
- ডুপ্লিকেট সাইড ইফেক্ট তৈরি না করে কি আমরা কোনো টাস্ক পুনরায় চালাতে পারি?
- নতুন করে শুরু না করেই কি মাঝপথে একজন মানুষ কাজটির দায়িত্ব নিতে পারেন?
সিনিয়র ইঞ্জিনিয়াররা ইতিমধ্যেই জানেন কীভাবে এটি সমাধান করতে হয়। আমরা বহু বছর আগেই পেমেন্ট এবং ব্যাকগ্রাউন্ড জবসের ক্ষেত্রে এই সমস্যাগুলো সমাধান করেছি। আমরা idempotency keys, checkpoints এবং transaction logs ব্যবহার করি। AI কেবল এই ব্যর্থতাগুলোকে আরও দ্রুত ঘটিয়ে তোলে।
মডেলের গুণমান সমীকরণের মাত্র একটি অংশ। একটি ত্রুটিপূর্ণ ওয়ার্কফ্লোতে একটি দুর্দান্ত মডেল কেবল বিশৃঙ্খলা সৃষ্টি করে। কিন্তু একটি শক্তিশালী ওয়ার্কফ্লোতে একটি মোটামুটি মানের মডেলও ভ্যালু তৈরি করে।
কেবল অনুমানের পিছে না ছুটে একটি ব্যবহারিক প্লেবুক (playbook) তৈরি করুন:
Split AI work into explicit steps.
collect_context,propose_change, এবংrun_checks-এর মতো ধাপ ব্যবহার করুন। একটি বিশাল প্রম্পট দিয়ে পুরো প্রক্রিয়াটি চালাতে দেবেন না।Use a database for durability. আপনার ওয়ার্কফ্লো স্ট্যাটাস এবং ইভেন্ট লগ Postgres-এর মতো একটি ডাটাবেসে সংরক্ষণ করুন। যদি কোনো ওয়ার্কার ক্র্যাশ করে, তবে আপনি মেমোরির পরিবর্তে স্টেট (state) থেকে তা পুনরুদ্ধার করতে পারবেন।
Enforce idempotency. ডেটা পরিবর্তন করে এমন প্রতিটি অ্যাকশনের জন্য একটি স্থিতিশীল কী (stable key) প্রয়োজন। যদি একটি ধাপ দুবার চলে, তবে ফলাফল একই থাকতে হবে।
Manage permissions with tiers. অনবরত অ্যাপ্রুভাল চাইবেন না। রিড-অনলি টাস্ক, লো-রিস্ক রাইট এবং হাই-ইমপ্যাক্ট পরিবর্তনের জন্য আলাদা টিয়ার (tiers) তৈরি করুন।
Track operational metrics. শুধুমাত্র ল্যাটেন্সি (latency) এবং খরচ ট্র্যাক করা বন্ধ করুন। রিট্রাই সাকসেস রেট, হিউম্যান ইন্টারভেনশন পয়েন্ট এবং রোলব্যাক ফ্রিকোয়েন্সি ট্র্যাক করুন।
সেরা AI টিমগুলো স্বায়ত্তশাসিত এজেন্ট (autonomous agents) নিয়ে বড়াই করবে না। তারা তৈরি করবে টেকসই এবং পর্যবেক্ষণযোগ্য (observable) পাইপলাইন। তাদের শক্তি কোনো জাদুকরী প্রম্পটে থাকবে না; বরং থাকবে সুশৃঙ্খল সিস্টেম ইঞ্জিনিয়ারিংয়ে।
মডেলগুলো প্রতি মাসে আরও বুদ্ধিমান হচ্ছে। আপনার আসল সুবিধা আসবে এমন ওয়ার্কফ্লো তৈরির মাধ্যমে, যা কোনো সমস্যা দেখা দিলে ঘাবড়ে যায় না।
Source: https://dev.to/chrisbuildsonline/your-team-doesnt-need-a-better-ai-model-this-week-2og7
Optional learning community: https://t.me/GyaanSetuAi
