আপনার কি দৈনন্দিন কাজের জন্য সবচেয়ে উন্নত AI প্রয়োজন?
প্রতি সপ্তাহে নতুন নতুন AI মডেল আসছে। মানুষ বেঞ্চমার্ক এবং কোডিং স্কোর নিয়ে বিতর্ক করছে। আমরা সবাই উত্তেজিত হয়ে পড়ি।
কিন্তু আমি ভিন্ন একটি প্রশ্ন করতে শুরু করেছি। আপনার দৈনন্দিন কাজের জন্য কি আসলেই সবচেয়ে উন্নত মডেলটির প্রয়োজন আছে?
আমি সম্প্রতি এটি পরীক্ষা করেছি। আমি একটি কোড রিফ্যাক্টরিং (code refactoring) কাজের জন্য দুটি মডেলের মধ্যে তুলনা করেছি।
- Sonnet-এর খরচ হয়েছে 76.1 ক্রেডিট।
- Haiku-এর খরচ হয়েছে 13.3 ক্রেডিট।
Haiku ছিল 5.7x সস্তা। আমি আশা করেছিলাম দামী মডেলটিই জিতবে। কিন্তু তা হয়নি।
Haiku আরও ভালো ফলাফল দিয়েছে। এটি কোডটিকে তিনটি পরিষ্কার ফাইলে বিভক্ত করেছে। এটি Sonnet-এর চেয়ে আমাদের কোডিং স্ট্যান্ডার্ড আরও ভালোভাবে অনুসরণ করেছে। এটি ছিল সস্তা এবং আরও কার্যকর।
বড় এবং দামী মানেই ভালো নয়।
মডেলের সক্ষমতা প্রক্রিয়ার একটি অংশ মাত্র। আমি আরও ভালো ফলাফল পেতে একটি AI development harness ব্যবহার করি। এই harness-এর অন্তর্ভুক্ত হলো:
• রিপোজিটরি-নির্দিষ্ট নির্দেশনা (Repository-specific instructions) • কোডিং স্ট্যান্ডার্ড (Coding standards) • আর্কিটেকচারাল গাইডেন্স (Architectural guidance) • ডেভেলপমেন্ট ওয়ার্কফ্লো (Development workflows) • প্রজেক্ট কনটেক্সট (Project context) • রিভিউ সংক্রান্ত প্রত্যাশা (Review expectations)
যখন আপনি এই গার্ডরেলগুলো (guardrails) তৈরি করেন, তখন ছোট মডেলগুলো আরও ভালো পারফর্ম করে। ভালো কোড দেখতে কেমন হবে তা মডেলটি নিজে থেকে অনুমান করে না। পরিবেশ তাকে তা বলে দেয়।
বেশিরভাগ ইঞ্জিনিয়ারিং কাজ গবেষণা সংক্রান্ত সমস্যা নয়। রিফ্যাক্টরিং, টেস্ট লেখা বা ডকুমেন্টেশন তৈরির মতো কাজের জন্য বিশাল কোনো মডেলের প্রয়োজন হয় না।
কোন মডেলের বেঞ্চমার্ক সবচেয়ে বেশি তা জিজ্ঞেস করা বন্ধ করুন। পরিবর্তে এই প্রশ্নগুলো করুন:
- কাজটি কি সম্পন্ন হয়েছে?
- ফলাফলটি কি রক্ষণাবেক্ষণ করা সহজ?
- এটি কি প্রজেক্টের স্ট্যান্ডার্ড অনুসরণ করে?
- খরচ কি কাজের তুলনায় যুক্তিযুক্ত ছিল?
- টিম কি এটি সস্তায় স্কেল করতে পারবে?
আপনার সমস্যা সমাধানের জন্য সবচেয়ে কম খরচের মডেলটি ব্যবহার করুন।
AI শিল্প বুদ্ধিমত্তার ওপর গুরুত্ব দেয়। আপনার উচিত harness-এর গুণমানের ওপর গুরুত্ব দেওয়া। একটি মডেল যা 5.7x কম খরচে পাওয়া যায়, সেটিও আরও ভালো ফলাফল দিতে পারে যদি আপনি তাকে সঠিক কনটেক্সট প্রদান করেন।
ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi