আপনার টিমের এই সপ্তাহে আরও উন্নত কোনো AI মডেলের প্রয়োজন নেই
নতুন AI মডেল খোঁজা বন্ধ করুন। আপনার যা প্রকৃত আপগ্রেড প্রয়োজন তা হলো আপনার ওয়ার্কফ্লো (workflow)।
বেশিরভাগ টিম কোন মডেলটি বেশি বুদ্ধিমান তা নিয়ে মনোযোগ দেয়। তারা নতুন রিলিজগুলোর বেঞ্চমার্কিং করে এবং বুদ্ধিমত্তা নিয়ে বিতর্ক করে। কিন্তু আপনি যদি LLM দিয়ে কিছু তৈরি করেন, তবে আপনি আসল সমস্যাটি জানেন। সমস্যাটি খারাপ কোড নয়। সমস্যাটি হলো খারাপ এক্সিকিউশন (execution)।
আপনি এই সমস্যাগুলো দেখতে পান:
- এজেন্ট লুপ (Agent loops) যা কোনো কাজের মাঝপথে থেমে যায়।
- অ্যাপ্রুভাল প্রম্পট (Approval prompts) যা মানুষকে বিভ্রান্ত করে।
- কনটেক্সট চেইন (Context chains) যা রিট্রাই করার সময় ভেঙে যায়।
- অটোমেশন তার স্টেট (state) হারিয়ে ফেললে মানুষের তা ঠিক করতে হওয়া।
বুদ্ধিমত্তা বাড়ছে, কিন্তু অপারেশনাল কন্ট্রোল (operational control) পিছিয়ে পড়ছে। আমরা এখন 'অরকেস্ট্রেশন ট্যাক্স' (orchestration tax)-এর যুগে প্রবেশ করছি। আপনি যদি এর জন্য পরিকল্পনা না করেন, তবে আপনাকে সিস্টেম আউটটেজ এবং সাইলেন্ট ফেইলিউরের (silent failures) মাধ্যমে এর মূল্য দিতে হবে।
AI-এর আউটপুট খুব কমই চূড়ান্ত পণ্য হয়। এটি একটি বৃহত্তর সিস্টেমের একটি মধ্যবর্তী ধাপ মাত্র। আপনাকে এই প্রশ্নগুলোর সমাধান করতে হবে:
- টাইমআউটের পরে কি কাজটি পুনরায় শুরু করা সম্ভব?
- আমরা কি প্রতিটি অ্যাপ্রুভাল অডিট করতে পারি?
- ডুপ্লিকেট অ্যাকশন ছাড়াই কি আমরা ধাপগুলো পুনরায় চালাতে পারি?
- কাজের মাঝপথে কি একজন মানুষ নিয়ন্ত্রণ নিতে পারেন?
সিনিয়র ইঞ্জিনিয়াররা বছরের পর বছর আগে পেমেন্ট এবং ব্যাকগ্রাউন্ড জবসের ক্ষেত্রে এই সমস্যাগুলো সমাধান করেছিলেন। আমরা idempotency keys, checkpoints এবং transaction logs ব্যবহার করতাম। AI এই সমস্যাগুলো তৈরি করেনি। এটি কেবল এগুলোকে আরও দ্রুত ঘটাচ্ছে।
আপনার এক্সিকিউশন কন্ট্রাক্ট (execution contract) ঠিক করার আগে কোনো মডেল বেছে নেবেন না। এটি ব্রেকহীন একটি গাড়ির জন্য রেসিং ইঞ্জিন বেছে নেওয়ার মতো।
এই ধাপগুলো ব্যবহার করে একটি নির্ভরযোগ্য ওয়ার্কফ্লো তৈরি করুন:
AI কাজগুলোকে ছোট ছোট ধাপে ভাগ করুন একটি বিশাল প্রম্পট ব্যবহার করবেন না। এটিকে ভেঙে ফেলুন: কনটেক্সট সংগ্রহ করা, পরিবর্তনের প্রস্তাব দেওয়া, চেক চালানো, অ্যাপ্রুভাল চাওয়া এবং পরিবর্তন প্রয়োগ করা।
ডিউরেবল স্টোরেজ (durable storage) ব্যবহার করুন স্ট্যাটাস, ধাপ এবং প্রচেষ্টার সংখ্যা ট্র্যাক করতে একটি ডাটাবেস ব্যবহার করুন। যদি কোনো ওয়ার্কার ক্র্যাশ করে, তবে আপনি মেমরি নয়, বরং স্টেট (state) থেকে রিকভার করবেন।
আইডেমপোটেন্সি (idempotency) নিশ্চিত করুন ডেটা পরিবর্তন করে এমন প্রতিটি অ্যাকশনের জন্য একটি স্থিতিশীল কী (key) প্রয়োজন। যদি একটি ধাপ দুবার চলে, তবে ফলাফল একই থাকতে হবে।
টিয়ার (tiers) দিয়ে পারমিশন ম্যানেজ করুন প্রতিনিয়ত অ্যাপ্রুভাল চাওয়া বন্ধ করুন। টিয়ার তৈরি করুন:
- Tier 0: রিড-অনলি কাজ (স্বয়ংক্রিয়ভাবে অনুমোদিত)।
- Tier 1: কম ঝুঁকির রাইট অপারেশন (ব্যাচ অ্যাপ্রুভাল)।
- Tier 2: উচ্চ-প্রভাবশালী কাজ (হিউম্যান চেকপয়েন্ট)।
- অপারেশনাল মেট্রিক্স (operational metrics) ট্র্যাক করুন শুধুমাত্র ল্যাটেন্সি (latency) এবং খরচের দিকে তাকানো বন্ধ করুন। টাইমআউট রেট, রিট্রাই সাকসেস এবং রোলব্যাক ফ্রিকোয়েন্সি ট্র্যাক করুন।
সেরা AI টিমগুলো ম্যাজিক প্রম্পট নিয়ে দম্ভ করবে না। তারা বিরক্তিকর, টেকসই এবং অবজারভেবল (observable) পাইপলাইন চালাবে। তাদের বিশেষত্ব মডেল নয়। তাদের বিশেষত্ব হলো সুশৃঙ্খল সিস্টেম ইঞ্জিনিয়ারিং।
Source: https://dev.to/chrisbuildsonline/your-team-doesnt-need-a-better-ai-model-this-week-29l4
Optional learning community: https://t.me/GyaanSetuAi
