Anthropic মানুষের দিকটি পরিমাপ করেছে। পাঁচজন অপারেটর এজেন্টের দিকটি তৈরি করছেন।
Anthropic Claude Code-এর ওপর নতুন গবেষণা প্রকাশ করেছে। তারা ২,৩৫,০০০ মানুষের ৪,০০,০০০টি সেশন নিয়ে গবেষণা করেছে। তাদের প্রাপ্ত ফলাফল দেখায় যে মানুষের দক্ষতা কীভাবে এজেন্টের পারফরম্যান্স পরিবর্তন করে।
তথ্যগুলো একটি স্পষ্ট প্যাটার্ন দেখায়। বিশেষজ্ঞরা প্রতিটি নির্দেশনার মাধ্যমে বেশি কাজ সম্পন্ন করেন। নতুনদের (novice) সেশনের তুলনায় বিশেষজ্ঞদের সেশনে প্রতি প্রম্পটে ২.৪ গুণ বেশি অ্যাকশন সম্পন্ন হয়। তারা ৫ গুণ বেশি টেক্সট আউটপুটও দেখতে পান।
সাফল্য নির্ভর করে আপনি সমস্যাটি কতটা ভালোভাবে বোঝেন তার ওপর। এটি আপনার কোডিং প্রশিক্ষণের ওপর নির্ভর করে না। দক্ষতা agentic work-এর জন্য একটি multiplier হিসেবে কাজ করে।
Anthropic মানুষের দিকটি পরিমাপ করলেও একটি ঘাটতি রয়ে গেছে। তারা এজেন্টের দিকটি নিয়ে গবেষণা করেনি। মেমরি, স্টেট বা গভর্নেন্স কীভাবে বিভিন্ন সেশনের মধ্যে কাজকে আরও উন্নত করতে সাহায্য করে, তা তারা দেখেনি।
পাঁচজন বিশেষজ্ঞ সেই ঘাটতি পূরণের সমাধান তৈরি করছেন। তারা এমন একটি আর্কিটেকচারের ওপর গুরুত্ব দিচ্ছেন যা এজেন্টের reasoning loop-এর বাইরে অবস্থান করে।
- Rapls status fields এবং decision logs নিয়ে কাজ করছে।
- Scarab Systems governed baselines এবং enforcement-এর ওপর গুরুত্ব দিচ্ছে।
- NOVAInetwork অপারেটর ডিসিপ্লিন স্কেল করতে quorum ব্যবহার করছে।
- Raffaele Zarrelli slow loops-এর structural pressure নিয়ে গবেষণা করছেন।
- Brian Hall open-source architecture-এর মাধ্যমে deterministic gates তৈরি করছেন।
এই পাঁচজন মানুষ একটি সিদ্ধান্তে পৌঁছেছেন। LLM ধারণা প্রস্তাব করে। Deterministic rules সেগুলো কার্যকর করে। মানুষ transitions গুলো অনুমোদন করে। নিয়মগুলোকে অবশ্যই এজেন্টের বাইরে থাকতে হবে।
মানুষ যখন লুপে দক্ষতা নিয়ে আসে তখন কী ঘটে, Anthropic তা পরিমাপ করেছে। এই দলটি তৈরি করছে কীভাবে সেই দক্ষতা বিভিন্ন টুল এবং এজেন্টের মধ্যে টিকে থাকবে।
দুটি স্বতন্ত্র সংকেত একই সমস্যার দিকে নির্দেশ করছে। এটি কোনো ট্রেন্ড নয়। এটি আমাদের তৈরির পদ্ধতির একটি পরিবর্তন।
অপারেটর ডিসিপ্লিন ব্যক্তিগত ওয়ার্কফ্লো থেকে একটি কোর আর্কিটেকচারে রূপান্তরিত হচ্ছে। পরবর্তী ধাপটি কী হবে, তা আপনাকে তৈরি, পরিমাপ এবং পরিচালনা করতে হবে।
Source: https://www.anthropic.com/research/claude-code-expertise
Optional learning community: https://t.me/GyaanSetuAi