𝗠𝗲𝗻𝘆𝗲𝗹𝗶𝗱𝗶𝗸𝗶 𝗞𝗲𝗰𝗲𝗿𝗱𝗮𝘀𝗮𝗻 𝗜𝗹𝗺𝗶𝗮𝗵 𝗱𝗮𝗹𝗮𝗺 𝗟𝗟𝗠

Para peneliti ingin mengetahui apakah Large Language Models memiliki kecerdasan ilmiah.

Sebagian besar pengujian berfokus pada fakta-fakta sederhana. Studi ini menggunakan alur kerja yang selaras dengan cara kerja ilmuwan sungguhan.

Para peneliti menguji bagaimana model menangani penalaran ilmiah yang kompleks.

Temuan utama:

  • Model saat ini kesulitan dengan alur kerja ilmiah yang panjang.
  • Kesalahan penalaran terjadi selama proses multi-langkah.
  • Penyelarasan dengan metode ilmiah meningkatkan akurasi.

Anda harus memperhatikan alur kerja ini untuk memahami batasan AI dalam penelitian. Benchmark standar tidak menunjukkan gambaran secara menyeluruh.

Sumber: https://dev.to/paperium/probing-scientific-general-intelligence-of-llms-with-scientist-aligned-workflows-26el

Komunitas belajar opsional: https://t.me/GyaanSetuAi