আমি কীভাবে একা একাধিক অ্যাপ চালাই: দ্য এজেন্ট হারনেস

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialগত সপ্তাহ2min read

আমি কীভাবে একা একাধিক অ্যাপ চালাই: দ্য এজেন্ট হারনেস (The Agent Harness)

আমি একা বেশ কিছু ছোট অ্যাপ তৈরি এবং রক্ষণাবেক্ষণ করি। আমার কোনো কো-ফাউন্ডার নেই, কোনো কর্মচারী নেই এবং কোনো কন্ট্রাক্টরও নেই। আমি একজন মানুষ এবং একদল AI এজেন্ট ব্যবহার করি।

মানুষ মনে করে AI আমাকে দ্রুত কোড করতে সাহায্য করে। গোপন রহস্যটি তা নয়।

গোপন রহস্যটি হলো, আমি প্রমাণ ছাড়া AI-কে কোনো কাজ সম্পন্ন হয়েছে বলে ঘোষণা করতে দিই না। আপনি যখন একা কাজ করেন, তখন বিপদ ধীরগতির কাজে নয়। বিপদ হলো আত্মবিশ্বাসের সাথে ভুল করা।

একটি AI আপনাকে বলবে যে টেস্টগুলো সফল হয়েছে, এমনকি যদি সে সেগুলো কখনোই না চালায় তবুও। এটি একটি ফিচার শেষ হয়েছে বলে দাবি করবে যখন এটি কেবল একটি ফাংশন নাম লিখে থাকবে। ভুল ধরার জন্য কোনো সহকর্মী না থাকলে, একটি ভুল "looks good" আপনার অ্যাপ নষ্ট করে দিতে পারে।

আমি 'the harness' নামে একটি সিস্টেম তৈরি করেছি। এটি ভুলভাবে কাজ শেষ করার প্রক্রিয়াটিকে ব্যয়বহুল করে তোলে। এটি নিশ্চিত করতে যে AI সত্য বলছে কি না, সেখানে এটি বিশেষায়িত এজেন্ট এবং ভেরিফিকেশন গেট ব্যবহার করে।

এটি যেভাবে কাজ করে:

• বিশেষায়িত এজেন্ট: একজন অ্যাসিস্ট্যান্টের পরিবর্তে, আমি চল্লিশটি বিশেষায়িত এজেন্ট ব্যবহার করি। একজন Flutter কোড রিভিউ করে। একজন নিরাপত্তা পরীক্ষা করে। একজন টেস্ট চালায়। একজন দাবিগুলোর সাথে প্রকৃত পরিবর্তনের তুলনা করে রিয়েলিটি অডিট (reality audit) করে। • বিচ্ছিন্ন কাজ: এজেন্টরা আলাদা, সাময়িক পরিবেশে কাজ করে। তারা একে অপরের কাজ মুছে ফেলতে পারে না। • রিডানডেন্সি (Redundancy): আমি একটি পরিবর্তনের জন্য একাধিক রিভিউয়ার ব্যবহার করি। একজন রিভিউয়ার হয়তো একটি বাগ (bug) মিস করতে পারেন। ভিন্ন ভিন্ন লক্ষ্য নিয়ে তিনজন রিভিউয়ার এবং একজন সংশয়বাদী (skeptic) সেটি খুঁজে বের করবে। • নির্দিষ্ট পাইপলাইন: প্রতিটি কাজ একটি কঠোর পথ অনুসরণ করে:

কাজগুলোর পরিকল্পনা করা।
পরিবর্তনটি বাস্তবায়ন করা।
কোডটি বাস্তবে চালানো। আমি "আমার মনে হয় এটি কাজ করবে" - এমন কথা গ্রহণ করি না। আমি কেবল প্রকৃত আউটপুট গ্রহণ করি।
রিয়েলিটি অডিট। একটি আলাদা এজেন্ট পরীক্ষা করে দেখে যে কোডটি দাবির সাথে মিলছে কি না।
রিভিউ। একজন ভাষা বিশেষজ্ঞ কাজটি পরীক্ষা করেন।
ভেরিফাই গেট। একটি চূড়ান্ত ধাপ প্রকৃত পরিবর্তন এবং সিকিউরিটি লিক পরীক্ষা করে। এটি PASS অথবা REJECT প্রদান করে।

এই সিস্টেমটি আমার নিজের কাছে করা মিথ্যা বলা বন্ধ করে দেয়।

"এটি কাজ করার কথা" - এটি এক্সিকিউশন পর্যায়ে ব্যর্থ হয়। "সম্পন্ন" - যদি কোডটি কেবল একটি ফাঁপা কাঠামো হয়, তবে এটি রিয়েলিটি অডিটে ব্যর্থ হয়। "All green" - যদি কোনো ওয়ার্নিং লুকিয়ে রাখা হয়, তবে এটি ব্যর্থ হয়।

আমি একটি তিন-স্তরের মেমরি সিস্টেমও ব্যবহার করি। এটি একটি শর্ট ইনডেক্স, লং-টার্ম নোট এবং ফুল-টেক্সট সার্চ ব্যবহার করে। এটি AI-কে অতীতে আমি কীভাবে সবকিছু সেটআপ করেছিলাম তা নিয়ে অনুমান করতে বাধা দেয়।

সবচেয়ে গুরুত্বপূর্ণ নিয়মটি হলো এটি: আমি কাজ স্বয়ংক্রিয় করি, কিন্তু বিচারবুদ্ধি (judgment) কখনোই স্বয়ংক্রিয় করি না।

• পাবলিশিং ম্যানুয়াল। আমি বাটনটি চাপি। • লাইভ করার জন্য আমার প্রয়োজন। আমি প্রতিটি পেমেন্ট বা রিলিজ সেটিংস অনুমোদন করি। • কোনো ব্যর্থতায় কিছু মার্জ (merge) হয় না। একটি ত্রুটিপূর্ণ বিল্ড (build) সবকিছু আটকে দেয়।

AI-এর সুবিধা আসে কাজগুলো স্বয়ংক্রিয় করার মাধ্যমে। আর নিরাপত্তা আসে সিদ্ধান্তগুলো স্বয়ংক্রিয় করতে অস্বীকার করার মাধ্যমে।

আপনি যখন একা কাজ করেন, তখন আপনার সবচেয়ে মূল্যবান সম্পদ হলো বিশ্বাস। আপনি অবশ্যই বিশ্বাস করতে হবে যে আপনি যা শিপ (ship) করেছেন তা-ই আপনি শিপ করার পরিকল্পনা করেছিলেন।

ছোট থেকে শুরু করুন। আপনি সবচেয়ে বেশি যে ভুলটি করেন তা খুঁজে বের করুন। এমন একটি চেক তৈরি করুন যা সেই ভুলটিকে অসম্ভব করে তোলে।

Source: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i

Optional learning community: https://t.me/GyaanSetuAi

আমি কীভাবে একা একাধিক অ্যাপ চালাই: দ্য এজেন্ট হারনেস

Continue reading

সবচেয়ে নিরাপদ সীমানা হলো সেটি যা এজেন্ট অতিক্রম করতে পারে না

কেউ আপনার রোবটের PR রিভিউ করছে না

আপনার এআই এজেন্টের নিরাপত্তা নির্ভর করে তার ব্যবহৃত টুলগুলোর ওপর

Creating Specialized AI Agents

আপনার AI এজেন্টের কতটা স্বায়ত্তশাসন থাকা উচিত?