LLMs میں سائنسی ذہانت کا جائزہ

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial11 گھنٹے پہلے1min read

LLMs میں سائنسی ذہانت کی جانچ

محققین یہ جاننا چاہتے ہیں کہ کیا Large Language Models سائنسی ذہانت رکھتے ہیں۔

زیادہ تر ٹیسٹ سادہ حقائق پر توجہ مرکوز کرتے ہیں۔ یہ مطالعہ ایسے ورک فلو (workflows) کا استعمال کرتا ہے جو حقیقی سائنسدانوں کے کام کرنے کے طریقے کے مطابق ہیں۔

محققین نے اس بات کا تجربہ کیا کہ ماڈلز پیچیدہ سائنسی استدلال (reasoning) کو کس طرح سنبھالتے ہیں۔

اہم نتائج:

موجودہ ماڈلز طویل سائنسی ورک فلو کے ساتھ جدوجہد کرتے ہیں۔
کثیر مرحلہ وار عمل کے دوران استدلال کی غلطیاں ہوتی ہیں۔
سائنسی طریقوں کے ساتھ ہم آہنگی درستگی کو بہتر بناتی ہے۔

تحقیق میں AI کی حدود کو سمجھنے کے لیے آپ کو ان ورک فلو کا جائزہ لینا چاہیے۔ معیاری بینچ مارکس (benchmarks) مکمل تصویر پیش نہیں کرتے۔

ماخذ: https://dev.to/paperium/probing-scientific-general-intelligence-of-llms-with-scientist-aligned-workflows-26el

اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi

LLMs میں سائنسی ذہانت کا جائزہ

Continue reading

𝗔𝗹𝗶𝗴𝗻𝗺𝗲𝗻𝘁 𝗙𝗮𝗸𝗶𝗻𝗴 𝗜𝗻 𝗟𝗟𝗠𝘀

موثر LLM سرونگ کی جانب

اسٹریم آف سرچ (SoS): زبان میں تلاش کرنا سیکھنا

InternLM Math: قابلِ تصدیق ریاضیاتی استدلال

𝗟𝗟𝗠𝘀 𝗙𝗼𝗿 𝗟𝗮𝗻𝗴𝘂𝗮𝗴𝗲 𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴