এআই এজেন্ট এখন পেশাদার মানের ১৬% ফ্রিল্যান্স কাজ সম্পন্ন করছে

Translated for your language. Read the original.

AI-assisted draft.

এআই এজেন্ট এখন পেশাদার মানের ১৬% ফ্রিল্যান্স কাজ সম্পন্ন করছে

In this article

AI এজেন্ট এখন পেশাদার মানের ১৬% ফ্রিল্যান্স কাজ সম্পন্ন করছে

রিমোট লেবার বা দূরবর্তী শ্রমের প্রেক্ষাপট অত্যন্ত দ্রুতগতিতে পরিবর্তিত হচ্ছে, কারণ AI এজেন্টগুলো জটিল এবং বাণিজ্যিকভাবে মূল্যবান কাজ সম্পন্ন করার ক্রমবর্ধমান সক্ষমতা প্রদর্শন করছে। নতুন তথ্য প্রকাশ করেছে যে, পেশাদার মানের ফ্রিল্যান্স কাজের ক্ষেত্রে সর্বোচ্চ অটোমেশন রেট বা স্বয়ংক্রিয়তার হার আট মাসেরও কম সময়ে চারগুণ বৃদ্ধি পেয়েছে।

রিমোট লেবার ইনডেক্সের দ্রুত উত্থান

রিমোট লেবার ইনডেক্স (RLI), যা Scale Labs-এর সহযোগিতায় Center for AI Safety (CAIS) দ্বারা তৈরি একটি বেঞ্চমার্ক, এটি ট্র্যাক করে যে AI এজেন্টগুলো কত ঘনঘন অর্থপ্রদানকারী ক্লায়েন্টদের গ্রহণযোগ্য মানের পেইড ফ্রিল্যান্স প্রজেক্ট সম্পন্ন করতে পারে। সাধারণ টেক্সট জেনারেশন বেঞ্চমার্কের বিপরীতে, RLI উচ্চ-ঝুঁকিপূর্ণ ক্ষেত্রগুলোর ওপর গুরুত্ব দেয়, যার মধ্যে রয়েছে 3D/CAD, আর্কিটেকচার, গ্রাফিক ডিজাইন, ভিডিও অ্যানিমেশন, অডিও ইঞ্জিনিয়ারিং এবং ওয়েব অ্যাপ ডেভেলপমেন্ট।

এই গবেষণায় ৩৫৮ জন যাচাইকৃত ফ্রিল্যান্সারের কাছ থেকে সংগৃহীত মোট ১৪৪,০০০ ডলার মূল্যের ২৪০টি প্রজেক্ট বিশ্লেষণ করা হয়েছে। ফলাফলগুলো সক্ষমতার এক বিশাল উল্লম্ফন প্রদর্শন করে: মাত্র আট মাস আগে, সর্বোচ্চ অটোমেশন রেট ছিল মাত্র ২.৫ শতাংশ। আজ তা বেড়ে দাঁড়িয়েছে ১৬.১ শতাংশে।

অটোমেশনের নতুন দিগন্তে নেতৃত্ব দিচ্ছে Fable 5

সর্বশেষ RLI ফলাফল মডেলের পারফরম্যান্সে একটি উল্লেখযোগ্য বৃদ্ধি নির্দেশ করে, যেখানে Fable 5 বর্তমান লিডার হিসেবে আবির্ভূত হয়েছে। Fable 5 ১৬.১ শতাংশ অটোমেশন রেট অর্জন করেছে, যা এর নিকটতম প্রতিদ্বন্দ্বী Opus 4.8-এর পারফরম্যান্সের (৮.৩ শতাংশ) প্রায় দ্বিগুণ। অন্যান্য উল্লেখযোগ্য পারফর্মারদের মধ্যে ছিল GPT-5.5, যা ৬.৩ শতাংশে পৌঁছেছে।

এই দ্রুত অগ্রগতি বিশেষায়িত এজেন্টিক ওয়ার্কফ্লোর (agentic workflows) ক্রমবর্ধমান সক্ষমতাকে তুলে ধরে। এই ফলাফল অর্জনের জন্য, টেস্টিং এনভায়রনমেন্টে Blender, GIMP এবং Audacity-এর মতো ৩০টিরও বেশি পেশাদার অ্যাপ্লিকেশন সমৃদ্ধ ভার্চুয়াল Linux মেশিন ব্যবহার করা হয়েছে। প্রতিটি প্রজেক্টের জন্য এজেন্টদের ২৪ ঘণ্টা পর্যন্ত কম্পিউট টাইম দেওয়া হয় এবং তারা একটি "critic loop" ব্যবহার করে—যা একটি সেকেন্ডারি AI এজেন্ট, যা একজন মানুষের মতো ক্লায়েন্টের কঠোর মনোভাব অনুকরণ করার জন্য কাজগুলো পর্যালোচনা করে এবং সংশোধনের পরামর্শ দেয়।

AI বিচারক এবং পেশাদার সফটওয়্যারের সীমাবদ্ধতা

এই অগ্রগতি সত্ত্বেও, রিপোর্টটি একটি গুরুত্বপূর্ণ প্রতিবন্ধকতা তুলে ধরেছে: পেশাদার নির্ভুলতার ক্ষেত্রে "লাস্ট মাইল" বা শেষ পর্যায়ের কাজ সম্পন্ন করতে AI এজেন্টগুলো এখনও হিমশিম খাচ্ছে। উদাহরণস্বরূপ, আর্কিটেকচার সংক্রান্ত কাজে দেখা গেছে যে, GPT-5.5 আকর্ষণীয় ভিজ্যুয়াল রেন্ডার তৈরি করলেও এর অন্তর্নিহিত 3D জ্যামিতি ছিল মৌলিকভাবে ত্রুটিপূর্ণ।

এই গবেষণার একটি উল্লেখযোগ্য ফলাফল হলো যে, AI বিচারকরা এখনও মানুষের বিকল্প হতে পারে না। পরীক্ষার সময় দেখা গেছে যে, AI বিচারকরা অনেক বেশি নমনীয়; GPT-5.5-এর ক্ষেত্রে AI ইভ্যালুয়েটরের স্কোর ছিল মানুষের দ্বারা যাচাইকৃত প্রকৃত মানের তুলনায় প্রায় তিন গুণ বেশি। এই অমিলটি থাকার কারণ হলো, পেশাদার কাজ সঠিকভাবে বিচার করার জন্য বিশেষায়িত সফটওয়্যারের সাথে গভীরভাবে কাজ করার ক্ষমতা প্রয়োজন—যেখানে বর্তমান AI এজেন্টগুলো এখনও উল্লেখযোগ্য বাধার সম্মুখীন হচ্ছে।

এজেন্টগুলো যখন সাধারণ চ্যাট ইন্টারফেস থেকে জটিল গ্রাফিক্যাল প্রোগ্রাম পরিচালনায় পদার্পণ করছে, তখন ডিজিটাল অর্থনীতিতে "কাজ" কীভাবে সংজ্ঞায়িত এবং সম্পাদিত হবে, তার ক্ষেত্রে শিল্পটি একটি মৌলিক পরিবর্তনের সাক্ষী হচ্ছে।

মূল বিষয়সমূহ

এক্সপোনেনশিয়াল গ্রোথ: পেশাদার ফ্রিল্যান্স কাজের ক্ষেত্রে সর্বোচ্চ অটোমেশন রেট আট মাসেরও কম সময়ে ২.৫% থেকে লাফিয়ে ১৬.১%-এ পৌঁছেছে।
মডেল লিডারশিপ: Fable 5 বর্তমানে ১৬.১% অটোমেশন রেট নিয়ে শিল্পে নেতৃত্ব দিচ্ছে, যা Opus 4.8 (৮.৩%) এবং GPT-5.5 (৬.৩%)-কে উল্লেখযোগ্যভাবে ছাড়িয়ে গেছে।
মানুষের প্রয়োজনীয়তা: মানুষের মাধ্যমে মূল্যায়ন করা এখনও অপরিহার্য, কারণ AI বিচারকরা অনেক বেশি উদার হওয়ার প্রবণতা দেখায় এবং বিশেষায়িত সফটওয়্যার ফাইলের কাঠামোগত ত্রুটি শনাক্ত করার ক্ষমতা তাদের নেই।

এআই এজেন্ট এখন পেশাদার মানের ১৬% ফ্রিল্যান্স কাজ সম্পন্ন করছে

AI এজেন্ট এখন পেশাদার মানের ১৬% ফ্রিল্যান্স কাজ সম্পন্ন করছে

রিমোট লেবার ইনডেক্সের দ্রুত উত্থান

অটোমেশনের নতুন দিগন্তে নেতৃত্ব দিচ্ছে Fable 5

AI বিচারক এবং পেশাদার সফটওয়্যারের সীমাবদ্ধতা

মূল বিষয়সমূহ

Continue reading

নতুন AA Briefcase বেঞ্চমার্ক প্রকাশ করল প্রকৃত জ্ঞানমূলক কাজে এআই-এর সীমাবদ্ধতা

এজেন্টিক এআই-এর উত্থান: কেন প্রযুক্তি দলগুলো অটোমেশনের নতুন দিগন্তে নেতৃত্ব দিচ্ছে

কেন প্রচলিত এআই বেঞ্চমার্কসমূহ পদ্ধতিগতভাবে এজেন্টের সক্ষমতাকে অবমূল্যায়ন করে