LLM-এ বৈজ্ঞানিক বুদ্ধিমত্তা যাচাই করা
গবেষকরা জানতে চান যে লার্জ ল্যাঙ্গুয়েজ মডেলগুলোর (Large Language Models) মধ্যে বৈজ্ঞানিক বুদ্ধিমত্তা রয়েছে কি না।
বেশিরভাগ পরীক্ষা সাধারণ তথ্যের ওপর গুরুত্ব দেয়। এই গবেষণায় এমন ওয়ার্কফ্লো (workflows) ব্যবহার করা হয়েছে যা প্রকৃত বিজ্ঞানীদের কাজের পদ্ধতির সাথে সামঞ্জস্যপূর্ণ।
গবেষকরা পরীক্ষা করেছেন যে মডেলগুলো কীভাবে জটিল বৈজ্ঞানিক যুক্তি (scientific reasoning) মোকাবিলা করে।
মূল ফলাফলসমূহ:
- বর্তমান মডেলগুলো দীর্ঘ বৈজ্ঞানিক ওয়ার্কফ্লো নিয়ে কাজ করতে হিমশিম খায়।
- বহু-ধাপ বিশিষ্ট প্রক্রিয়ার সময় যুক্তিনির্ভর ভুল (reasoning errors) ঘটে।
- বৈজ্ঞানিক পদ্ধতির সাথে সামঞ্জস্য বজায় রাখলে নির্ভুলতা বৃদ্ধি পায়।
গবেষণায় এআই (AI)-এর সীমাবদ্ধতা বুঝতে আপনার এই ওয়ার্কফ্লোগুলোর দিকে নজর দেওয়া উচিত। প্রচলিত বেঞ্চমার্কগুলো (benchmarks) সম্পূর্ণ চিত্র তুলে ধরতে পারে না।
ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi