LLMs ਵਿੱਚ ਵਿਗਿਆਨਕ ਬੁੱਧੀ ਦੀ ਜਾਂਚ
ਖੋਜਕਰਤਾ ਇਹ ਜਾਣਨਾ ਚਾਹੁੰਦੇ ਹਨ ਕਿ ਕੀ Large Language Models ਵਿੱਚ ਵਿਗਿਆਨਕ ਬੁੱਧੀ ਹੈ।
ਜ਼ਿਆਦਾਤਰ ਟੈਸਟ ਸਧਾਰਨ ਤੱਥਾਂ 'ਤੇ ਕੇਂਦਰਿਤ ਹੁੰਦੇ ਹਨ। ਇਹ ਅਧਿਐਨ ਅਜਿਹੇ ਵਰਕਫਲੋਜ਼ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਜੋ ਅਸਲ ਵਿਗਿਆਨੀਆਂ ਦੇ ਕੰਮ ਕਰਨ ਦੇ ਤਰੀਕੇ ਦੇ ਅਨੁਕੂਲ ਹਨ।
ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਇਹ ਟੈਸਟ ਕੀਤਾ ਕਿ ਮਾਡਲ ਗੁੰਝਲਦਾਰ ਵਿਗਿਆਨਕ ਤਰਕ ਨੂੰ ਕਿਵੇਂ ਸੰਭਾਲਦੇ ਹਨ।
ਮੁੱਖ ਨਤੀਜੇ:
- ਮੌਜੂਦਾ ਮਾਡਲਾਂ ਨੂੰ ਲੰਬੇ ਵਿਗਿਆਨਕ ਵਰਕਫਲੋਜ਼ ਨਾਲ ਸੰਘਰਸ਼ ਕਰਨਾ ਪੈਂਦਾ ਹੈ।
- ਬਹੁ-ਪੜਾਅ ਦੀਆਂ ਪ੍ਰਕਿਰਿਆਵਾਂ ਦੌਰਾਨ ਤਰਕ ਵਿੱਚ ਗਲਤੀਆਂ ਹੁੰਦੀਆਂ ਹਨ।
- ਵਿਗਿਆਨਕ ਵਿਧੀਆਂ ਨਾਲ ਤਾਲਮੇਲ ਸ਼ੁੱਧਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰਦਾ ਹੈ।
ਖੋਜ ਵਿੱਚ AI ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਸਮਝਣ ਲਈ ਤੁਹਾਨੂੰ ਇਹਨਾਂ ਵਰਕਫਲੋਜ਼ ਵੱਲ ਦੇਖਣਾ ਚਾਹੀਦਾ ਹੈ। ਮਿਆਰੀ ਬੈਂਚਮਾਰਕਸ ਪੂਰੀ ਤਸਵੀਰ ਨਹੀਂ ਦਿਖਾਉਂਦੇ।
ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi