আমি কীভাবে একা একাধিক অ্যাপ চালাই: দ্য এজেন্ট হারনেস (The Agent Harness)

আমি একা বেশ কিছু ছোট অ্যাপ তৈরি এবং রক্ষণাবেক্ষণ করি। আমার কোনো কো-ফাউন্ডার নেই, কোনো কর্মচারী নেই এবং কোনো কন্ট্রাক্টরও নেই। আমি একজন মানুষ এবং একদল AI এজেন্ট ব্যবহার করি।

মানুষ মনে করে AI আমাকে দ্রুত কোড করতে সাহায্য করে। গোপন রহস্যটি তা নয়।

গোপন রহস্যটি হলো, আমি প্রমাণ ছাড়া AI-কে কোনো কাজ সম্পন্ন হয়েছে বলে ঘোষণা করতে দিই না। আপনি যখন একা কাজ করেন, তখন বিপদ ধীরগতির কাজে নয়। বিপদ হলো আত্মবিশ্বাসের সাথে ভুল করা।

একটি AI আপনাকে বলবে যে টেস্টগুলো সফল হয়েছে, এমনকি যদি সে সেগুলো কখনোই না চালায় তবুও। এটি একটি ফিচার শেষ হয়েছে বলে দাবি করবে যখন এটি কেবল একটি ফাংশন নাম লিখে থাকবে। ভুল ধরার জন্য কোনো সহকর্মী না থাকলে, একটি ভুল "looks good" আপনার অ্যাপ নষ্ট করে দিতে পারে।

আমি 'the harness' নামে একটি সিস্টেম তৈরি করেছি। এটি ভুলভাবে কাজ শেষ করার প্রক্রিয়াটিকে ব্যয়বহুল করে তোলে। এটি নিশ্চিত করতে যে AI সত্য বলছে কি না, সেখানে এটি বিশেষায়িত এজেন্ট এবং ভেরিফিকেশন গেট ব্যবহার করে।

এটি যেভাবে কাজ করে:

• বিশেষায়িত এজেন্ট: একজন অ্যাসিস্ট্যান্টের পরিবর্তে, আমি চল্লিশটি বিশেষায়িত এজেন্ট ব্যবহার করি। একজন Flutter কোড রিভিউ করে। একজন নিরাপত্তা পরীক্ষা করে। একজন টেস্ট চালায়। একজন দাবিগুলোর সাথে প্রকৃত পরিবর্তনের তুলনা করে রিয়েলিটি অডিট (reality audit) করে। • বিচ্ছিন্ন কাজ: এজেন্টরা আলাদা, সাময়িক পরিবেশে কাজ করে। তারা একে অপরের কাজ মুছে ফেলতে পারে না। • রিডানডেন্সি (Redundancy): আমি একটি পরিবর্তনের জন্য একাধিক রিভিউয়ার ব্যবহার করি। একজন রিভিউয়ার হয়তো একটি বাগ (bug) মিস করতে পারেন। ভিন্ন ভিন্ন লক্ষ্য নিয়ে তিনজন রিভিউয়ার এবং একজন সংশয়বাদী (skeptic) সেটি খুঁজে বের করবে। • নির্দিষ্ট পাইপলাইন: প্রতিটি কাজ একটি কঠোর পথ অনুসরণ করে:

  • কাজগুলোর পরিকল্পনা করা।
  • পরিবর্তনটি বাস্তবায়ন করা।
  • কোডটি বাস্তবে চালানো। আমি "আমার মনে হয় এটি কাজ করবে" - এমন কথা গ্রহণ করি না। আমি কেবল প্রকৃত আউটপুট গ্রহণ করি।
  • রিয়েলিটি অডিট। একটি আলাদা এজেন্ট পরীক্ষা করে দেখে যে কোডটি দাবির সাথে মিলছে কি না।
  • রিভিউ। একজন ভাষা বিশেষজ্ঞ কাজটি পরীক্ষা করেন।
  • ভেরিফাই গেট। একটি চূড়ান্ত ধাপ প্রকৃত পরিবর্তন এবং সিকিউরিটি লিক পরীক্ষা করে। এটি PASS অথবা REJECT প্রদান করে।

এই সিস্টেমটি আমার নিজের কাছে করা মিথ্যা বলা বন্ধ করে দেয়।

"এটি কাজ করার কথা" - এটি এক্সিকিউশন পর্যায়ে ব্যর্থ হয়। "সম্পন্ন" - যদি কোডটি কেবল একটি ফাঁপা কাঠামো হয়, তবে এটি রিয়েলিটি অডিটে ব্যর্থ হয়। "All green" - যদি কোনো ওয়ার্নিং লুকিয়ে রাখা হয়, তবে এটি ব্যর্থ হয়।

আমি একটি তিন-স্তরের মেমরি সিস্টেমও ব্যবহার করি। এটি একটি শর্ট ইনডেক্স, লং-টার্ম নোট এবং ফুল-টেক্সট সার্চ ব্যবহার করে। এটি AI-কে অতীতে আমি কীভাবে সবকিছু সেটআপ করেছিলাম তা নিয়ে অনুমান করতে বাধা দেয়।

সবচেয়ে গুরুত্বপূর্ণ নিয়মটি হলো এটি: আমি কাজ স্বয়ংক্রিয় করি, কিন্তু বিচারবুদ্ধি (judgment) কখনোই স্বয়ংক্রিয় করি না।

• পাবলিশিং ম্যানুয়াল। আমি বাটনটি চাপি। • লাইভ করার জন্য আমার প্রয়োজন। আমি প্রতিটি পেমেন্ট বা রিলিজ সেটিংস অনুমোদন করি। • কোনো ব্যর্থতায় কিছু মার্জ (merge) হয় না। একটি ত্রুটিপূর্ণ বিল্ড (build) সবকিছু আটকে দেয়।

AI-এর সুবিধা আসে কাজগুলো স্বয়ংক্রিয় করার মাধ্যমে। আর নিরাপত্তা আসে সিদ্ধান্তগুলো স্বয়ংক্রিয় করতে অস্বীকার করার মাধ্যমে।

আপনি যখন একা কাজ করেন, তখন আপনার সবচেয়ে মূল্যবান সম্পদ হলো বিশ্বাস। আপনি অবশ্যই বিশ্বাস করতে হবে যে আপনি যা শিপ (ship) করেছেন তা-ই আপনি শিপ করার পরিকল্পনা করেছিলেন।

ছোট থেকে শুরু করুন। আপনি সবচেয়ে বেশি যে ভুলটি করেন তা খুঁজে বের করুন। এমন একটি চেক তৈরি করুন যা সেই ভুলটিকে অসম্ভব করে তোলে।

Source: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i

Optional learning community: https://t.me/GyaanSetuAi