আপনার কি দৈনন্দিন কাজের জন্য সবচেয়ে উন্নত AI প্রয়োজন?

প্রতি সপ্তাহে নতুন নতুন AI মডেল আসছে। মানুষ বেঞ্চমার্ক এবং কোডিং স্কোর নিয়ে বিতর্ক করছে। আমরা সবাই উত্তেজিত হয়ে পড়ি।

কিন্তু আমি ভিন্ন একটি প্রশ্ন করতে শুরু করেছি। আপনার দৈনন্দিন কাজের জন্য কি আসলেই সবচেয়ে উন্নত মডেলটির প্রয়োজন আছে?

আমি সম্প্রতি এটি পরীক্ষা করেছি। আমি একটি কোড রিফ্যাক্টরিং (code refactoring) কাজের জন্য দুটি মডেলের মধ্যে তুলনা করেছি।

Haiku ছিল 5.7x সস্তা। আমি আশা করেছিলাম দামী মডেলটিই জিতবে। কিন্তু তা হয়নি।

Haiku আরও ভালো ফলাফল দিয়েছে। এটি কোডটিকে তিনটি পরিষ্কার ফাইলে বিভক্ত করেছে। এটি Sonnet-এর চেয়ে আমাদের কোডিং স্ট্যান্ডার্ড আরও ভালোভাবে অনুসরণ করেছে। এটি ছিল সস্তা এবং আরও কার্যকর।

বড় এবং দামী মানেই ভালো নয়।

মডেলের সক্ষমতা প্রক্রিয়ার একটি অংশ মাত্র। আমি আরও ভালো ফলাফল পেতে একটি AI development harness ব্যবহার করি। এই harness-এর অন্তর্ভুক্ত হলো:

• রিপোজিটরি-নির্দিষ্ট নির্দেশনা (Repository-specific instructions) • কোডিং স্ট্যান্ডার্ড (Coding standards) • আর্কিটেকচারাল গাইডেন্স (Architectural guidance) • ডেভেলপমেন্ট ওয়ার্কফ্লো (Development workflows) • প্রজেক্ট কনটেক্সট (Project context) • রিভিউ সংক্রান্ত প্রত্যাশা (Review expectations)

যখন আপনি এই গার্ডরেলগুলো (guardrails) তৈরি করেন, তখন ছোট মডেলগুলো আরও ভালো পারফর্ম করে। ভালো কোড দেখতে কেমন হবে তা মডেলটি নিজে থেকে অনুমান করে না। পরিবেশ তাকে তা বলে দেয়।

বেশিরভাগ ইঞ্জিনিয়ারিং কাজ গবেষণা সংক্রান্ত সমস্যা নয়। রিফ্যাক্টরিং, টেস্ট লেখা বা ডকুমেন্টেশন তৈরির মতো কাজের জন্য বিশাল কোনো মডেলের প্রয়োজন হয় না।

কোন মডেলের বেঞ্চমার্ক সবচেয়ে বেশি তা জিজ্ঞেস করা বন্ধ করুন। পরিবর্তে এই প্রশ্নগুলো করুন:

আপনার সমস্যা সমাধানের জন্য সবচেয়ে কম খরচের মডেলটি ব্যবহার করুন।

AI শিল্প বুদ্ধিমত্তার ওপর গুরুত্ব দেয়। আপনার উচিত harness-এর গুণমানের ওপর গুরুত্ব দেওয়া। একটি মডেল যা 5.7x কম খরচে পাওয়া যায়, সেটিও আরও ভালো ফলাফল দিতে পারে যদি আপনি তাকে সঠিক কনটেক্সট প্রদান করেন।

উৎস: https://dev.to/drottnings/do-we-really-need-the-most-advanced-ai-models-for-everyday-development-3n2b

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi