𝗔𝗜 𝗪𝗿𝗶𝘁𝗲𝘀 𝗖𝗼𝗱𝗲. 𝗜𝘁 𝗖𝗮𝗻'𝘁 𝗗𝗲𝗳𝗶𝗻𝗲 "𝗗𝗼𝗻𝗲."

আমি একটি AI slide deck generator তৈরি করেছি। আপনি একটি বিষয় লিখবেন এবং একটি প্রেজেন্টেশন পেয়ে যাবেন।

AI ডেমোটি তাৎক্ষণিকভাবে কাজ করেছিল। এটি একটি আউটলাইন তৈরি করেছিল। এটি স্লাইড তৈরি করেছিল। এটি একটি ফাইল এক্সপোর্ট করেছিল। আমার স্ক্রিনে এটিকে সম্পন্ন মনে হচ্ছিল।

এটি আসলে সম্পন্ন ছিল না।

AI প্রমাণ করেছিল যে একজন ব্যবহারকারী একবার একটি ডেক তৈরি করতে পারে। কিন্তু একটি আসল প্রোডাক্ট ভিন্ন। এটিকে একসাথে ১০০ জন ব্যবহারকারী সামলাতে হবে। এটি তাদের সঠিকভাবে বিল করতে হবে। কোনো ধাপ ব্যর্থ হলে এটিকে পুনরায় কাজ শুরু করতে হবে। এটিকে এমন একটি ফাইল এক্সপোর্ট করতে হবে যা প্রকৃতপক্ষে PowerPoint-এ খোলা যায়।

AI এই বিষয়গুলো যোগ করেনি কারণ আমি তাকে তা করতে বলিনি।

যখন আপনি AI দিয়ে কিছু তৈরি করেন, তখন কঠিন অংশটি ফিচার বর্ণনা করা নয়। কঠিন অংশটি হলো "সম্পন্ন" বা "done" বলতে আসলে কী বোঝায় তা সংজ্ঞায়িত করা।

আমি ভিত্তি হিসেবে Velobase Harness ব্যবহার করেছি। এটি auth, payments, credits এবং databases সামলে নেয়। এর ফলে আমি AI-কে শুধুমাত্র PPT জেনারেশনের দিকে মনোনিবেশ করতে পেরেছি।

সেখানেই "সম্পন্ন মনে হওয়া" এবং "আসলেই সম্পন্ন হওয়া"র মধ্যে পার্থক্য তৈরি হয়। আমি চারটি প্রধান ঘাটতি খুঁজে পেয়েছি:

  • Concurrency: AI মনে করে একটি সফল রান মানেই একটি ফিচার সম্পন্ন। একটি আসল সিস্টেমের জন্য টাস্কগুলোকে queues-এ ভাগ করা প্রয়োজন। আপনাকে প্রতিটি স্লাইডকে আলাদা একটি job হিসেবে তৈরি করতে হবে যাতে workers স্কেল করতে পারে।

  • Billing: AI একবার ক্রেডিট কেটে নিয়ে থেমে যাবে। একটি আসল প্রোডাক্টের জন্য একটি state machine প্রয়োজন। আপনাকে ক্রেডিট রিজার্ভ করতে হবে, প্রকৃত ব্যবহারের ভিত্তিতে settle করতে হবে এবং ব্যর্থ হলে refund করতে হবে।

  • Self-review: যদি backend নীরবে কোনো টাস্ক retry করে, তবে ব্যবহারকারী কেবল একটি স্পিনিং আইকন দেখতে পান। আপনাকে স্ট্যাটাস দেখাতে হবে। ব্যবহারকারীকে "checking" বা "redrawing" দেখতে পাওয়া উচিত যাতে তারা বুঝতে পারে সিস্টেমটি কাজ করছে।

  • Export: একটি স্লাইড ব্রাউজারে দেখতে চমৎকার হতে পারে কিন্তু PPTX ফাইলে সেটি ভেঙে যেতে পারে। প্রয়োজনীয়তা শুধু একটি ফাইল তৈরি করা নয়। প্রয়োজনীয়তা হলো ফাইলটি যেন ওয়েব প্রিভিউয়ের সাথে হুবহু মিলে যায়।

আমি আমার নির্দেশাবলী পরিবর্তন করেছি। আমি AI-কে ফিচার লিস্ট দেওয়া বন্ধ করে দিয়েছি। আমি তাকে acceptance criteria দিতে শুরু করেছি।

AI-এর জন্য আমার নতুন নিয়মগুলো:

  • একটি production-ready SaaS তৈরি করো, ডেমো নয়।
  • ১০০ জন concurrent users সাপোর্ট করো।
  • Planning এবং slide creation-এর জন্য স্বতন্ত্র queues ব্যবহার করো।
  • প্রতিটি model call-কে billing system-এর সাথে যুক্ত করো।
  • Credit balances-এর ওপর ভিত্তি করে টাস্ক pause এবং resume করো।
  • প্রতিটি স্লাইডের পর layout checks চালাও।
  • নিশ্চিত করো যেন PPTX export ভিজ্যুয়াল প্রিভিউয়ের সাথে মিলে যায়।
  • শুধুমাত্র success-এর জন্য নয়, concurrency এবং failure-এর জন্যও tests লেখো।

AI দ্রুত কোড লেখে। কিন্তু কোডকে কীভাবে shippable বা ব্যবহারের উপযোগী করতে হয়, তা সে জানে না। সে একটি লোকাল ডেমোকেই একটি পূর্ণাঙ্গ সিস্টেম হিসেবে গণ্য করে।

মানুষের ভূমিকা হলো ইঞ্জিনিয়ারিংয়ের সীমানা, ফেইলর কেস এবং বিজনেস রুলস নির্ধারণ করে দেওয়া।

Harness প্রদান করে SaaS ফাউন্ডেশন। AI লজিক পূরণ করে। আপনাকে শুধু সবচেয়ে নিখুঁত ইনপুট দিতে হবে।

আপনি যদি AI-নির্মিত কোনো প্রোডাক্ট শিপ করে থাকেন, তবে "এটি কাজ করছে" এবং "এটি গ্রাহকদের জন্য প্রস্তুত" — এই দুটির মধ্যে সবচেয়ে কঠিন ব্যবধানটি কী ছিল?

উৎস: https://dev.to/velobasex/ai-can-write-the-code-it-cant-tell-you-when-the-product-is-done-4oh6