LLM-এ বৈজ্ঞানিক বুদ্ধিমত্তা যাচাই করা

গবেষকরা জানতে চান যে লার্জ ল্যাঙ্গুয়েজ মডেলগুলোর (Large Language Models) মধ্যে বৈজ্ঞানিক বুদ্ধিমত্তা রয়েছে কি না।

বেশিরভাগ পরীক্ষা সাধারণ তথ্যের ওপর গুরুত্ব দেয়। এই গবেষণায় এমন ওয়ার্কফ্লো (workflows) ব্যবহার করা হয়েছে যা প্রকৃত বিজ্ঞানীদের কাজের পদ্ধতির সাথে সামঞ্জস্যপূর্ণ।

গবেষকরা পরীক্ষা করেছেন যে মডেলগুলো কীভাবে জটিল বৈজ্ঞানিক যুক্তি (scientific reasoning) মোকাবিলা করে।

মূল ফলাফলসমূহ:

  • বর্তমান মডেলগুলো দীর্ঘ বৈজ্ঞানিক ওয়ার্কফ্লো নিয়ে কাজ করতে হিমশিম খায়।
  • বহু-ধাপ বিশিষ্ট প্রক্রিয়ার সময় যুক্তিনির্ভর ভুল (reasoning errors) ঘটে।
  • বৈজ্ঞানিক পদ্ধতির সাথে সামঞ্জস্য বজায় রাখলে নির্ভুলতা বৃদ্ধি পায়।

গবেষণায় এআই (AI)-এর সীমাবদ্ধতা বুঝতে আপনার এই ওয়ার্কফ্লোগুলোর দিকে নজর দেওয়া উচিত। প্রচলিত বেঞ্চমার্কগুলো (benchmarks) সম্পূর্ণ চিত্র তুলে ধরতে পারে না।

উৎস: https://dev.to/paperium/probing-scientific-general-intelligence-of-llms-with-scientist-aligned-workflows-26el

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi