প্রতিদিনের কাজের জন্য কি আপনার সবচেয়ে উন্নত এআই প্রয়োজন?

📅2 hours ago⏱1 min read

আপনার কি দৈনন্দিন কাজের জন্য সবচেয়ে উন্নত AI প্রয়োজন?

প্রতি সপ্তাহে নতুন নতুন AI মডেল আসছে। মানুষ বেঞ্চমার্ক এবং কোডিং স্কোর নিয়ে বিতর্ক করছে। আমরা সবাই উত্তেজিত হয়ে পড়ি।

কিন্তু আমি ভিন্ন একটি প্রশ্ন করতে শুরু করেছি। আপনার দৈনন্দিন কাজের জন্য কি আসলেই সবচেয়ে উন্নত মডেলটির প্রয়োজন আছে?

আমি সম্প্রতি এটি পরীক্ষা করেছি। আমি একটি কোড রিফ্যাক্টরিং (code refactoring) কাজের জন্য দুটি মডেলের মধ্যে তুলনা করেছি।

Sonnet-এর খরচ হয়েছে 76.1 ক্রেডিট।
Haiku-এর খরচ হয়েছে 13.3 ক্রেডিট।

Haiku ছিল 5.7x সস্তা। আমি আশা করেছিলাম দামী মডেলটিই জিতবে। কিন্তু তা হয়নি।

Haiku আরও ভালো ফলাফল দিয়েছে। এটি কোডটিকে তিনটি পরিষ্কার ফাইলে বিভক্ত করেছে। এটি Sonnet-এর চেয়ে আমাদের কোডিং স্ট্যান্ডার্ড আরও ভালোভাবে অনুসরণ করেছে। এটি ছিল সস্তা এবং আরও কার্যকর।

বড় এবং দামী মানেই ভালো নয়।

মডেলের সক্ষমতা প্রক্রিয়ার একটি অংশ মাত্র। আমি আরও ভালো ফলাফল পেতে একটি AI development harness ব্যবহার করি। এই harness-এর অন্তর্ভুক্ত হলো:

• রিপোজিটরি-নির্দিষ্ট নির্দেশনা (Repository-specific instructions) • কোডিং স্ট্যান্ডার্ড (Coding standards) • আর্কিটেকচারাল গাইডেন্স (Architectural guidance) • ডেভেলপমেন্ট ওয়ার্কফ্লো (Development workflows) • প্রজেক্ট কনটেক্সট (Project context) • রিভিউ সংক্রান্ত প্রত্যাশা (Review expectations)

যখন আপনি এই গার্ডরেলগুলো (guardrails) তৈরি করেন, তখন ছোট মডেলগুলো আরও ভালো পারফর্ম করে। ভালো কোড দেখতে কেমন হবে তা মডেলটি নিজে থেকে অনুমান করে না। পরিবেশ তাকে তা বলে দেয়।

বেশিরভাগ ইঞ্জিনিয়ারিং কাজ গবেষণা সংক্রান্ত সমস্যা নয়। রিফ্যাক্টরিং, টেস্ট লেখা বা ডকুমেন্টেশন তৈরির মতো কাজের জন্য বিশাল কোনো মডেলের প্রয়োজন হয় না।

কোন মডেলের বেঞ্চমার্ক সবচেয়ে বেশি তা জিজ্ঞেস করা বন্ধ করুন। পরিবর্তে এই প্রশ্নগুলো করুন:

কাজটি কি সম্পন্ন হয়েছে?
ফলাফলটি কি রক্ষণাবেক্ষণ করা সহজ?
এটি কি প্রজেক্টের স্ট্যান্ডার্ড অনুসরণ করে?
খরচ কি কাজের তুলনায় যুক্তিযুক্ত ছিল?
টিম কি এটি সস্তায় স্কেল করতে পারবে?

আপনার সমস্যা সমাধানের জন্য সবচেয়ে কম খরচের মডেলটি ব্যবহার করুন।

AI শিল্প বুদ্ধিমত্তার ওপর গুরুত্ব দেয়। আপনার উচিত harness-এর গুণমানের ওপর গুরুত্ব দেওয়া। একটি মডেল যা 5.7x কম খরচে পাওয়া যায়, সেটিও আরও ভালো ফলাফল দিতে পারে যদি আপনি তাকে সঠিক কনটেক্সট প্রদান করেন।

উৎস: https://dev.to/drottnings/do-we-really-need-the-most-advanced-ai-models-for-everyday-development-3n2b

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi

প্রতিদিনের কাজের জন্য কি আপনার সবচেয়ে উন্নত এআই প্রয়োজন?

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

এআই মানে শুধু প্রম্পট নয়

আমি প্রতিদিন আমার এআই (AI) এর খরচ ট্র্যাক করি

আমি ৫টি কোডিং টাস্কের মাধ্যমে ১০টি AI মডেল পরীক্ষা করেছি