𝗠𝗲𝗻𝘆𝗲𝗹𝗶𝗱𝗶𝗸𝗶 𝗞𝗲𝗰𝗲𝗿𝗱𝗮𝘀𝗮𝗻 𝗜𝗹𝗺𝗶𝗮𝗵 𝗱𝗮𝗹𝗮𝗺 𝗟𝗟𝗠
Para peneliti ingin mengetahui apakah Large Language Models memiliki kecerdasan ilmiah.
Sebagian besar pengujian berfokus pada fakta-fakta sederhana. Studi ini menggunakan alur kerja yang selaras dengan cara kerja ilmuwan sungguhan.
Para peneliti menguji bagaimana model menangani penalaran ilmiah yang kompleks.
Temuan utama:
- Model saat ini kesulitan dengan alur kerja ilmiah yang panjang.
- Kesalahan penalaran terjadi selama proses multi-langkah.
- Penyelarasan dengan metode ilmiah meningkatkan akurasi.
Anda harus memperhatikan alur kerja ini untuk memahami batasan AI dalam penelitian. Benchmark standar tidak menunjukkan gambaran secara menyeluruh.
Komunitas belajar opsional: https://t.me/GyaanSetuAi