Margaret Atwood Memberi Amaran: Mengapa AI Masih Terperangkap dalam "Garbage In, Garbage Out"

Penulis terkenal Margaret Atwood baru-baru ini berkongsi kritikan pedas terhadap model bahasa besar (LLM), menonjolkan perjuangan berterusan dengan ketepatan dan integriti data. Pengalamannya menekankan satu kebenaran asas dalam era AI semasa: walaupun model yang paling canggih sekalipun dihadkan oleh kualiti data latihannya.

Eksperimen Claude: Pengajaran tentang Halusinasi

Berucap di Festival Sastera dan Budaya Babell di Porto, Portugal, penulis The Handmaid’s Tale itu mendedahkan pengalaman tunggalnya menggunakan Claude daripada Anthropic. Percubaan Atwood untuk menggunakan chatbot tersebut bagi mendapatkan maklumat tentang siri detektif British Father Brown telah berakhir dengan kegagalan yang menggambarkan konsep "halusinasi" dengan sempurna.

Menurut Atwood, model tersebut memberikan maklumat yang salah, seolah-olah "berbohong" kepada pengguna. Beliau menyatakan bahawa LLM tersebut berkemungkinan telah menyemak dan mengambil sampel sejumlah besar ulasan televisyen, tetapi kerana kritikan dalam talian biasanya mengelakkan spoiler, model tersebut telah terkeliru oleh corak dalam set latihannya. Nuansa teknikal ini menonjolkan cabaran utama bagi pembangun: LLM adalah enjin probabilistik yang mengutamakan padanan corak berbanding pengesahan fakta, yang sering membawa kepada output yang yakin tetapi salah.

Dilema Data: Garbage In, Garbage Out

Kritikan Atwood berpusat pada prinsip pengkomputeran yang malar: "garbage in, garbage out." Beliau menyatakan bahawa LLM dilatih menggunakan maklumat yang dikikis (scraped), diterbitkan sebelum ini, dan berpotensi ketinggalan zaman. Apabila sesebuah model diberikan data yang tidak lengkap, berat sebelah, atau tidak konsisten secara logik, output yang terhasil pasti akan mencerminkan kecacatan tersebut.

Bagi landskap AI yang lebih luas, ini berfungsi sebagai peringatan bahawa meningkatkan skala parameter model bukanlah pengganti kepada kualiti data. Memandangkan pembangun berusaha untuk mendapatkan set data yang lebih besar bagi memacu keupayaan penaakulan, "hingar" (noise) dalam set data tersebut—seperti ketiadaan spoiler plot dalam ulasan yang dinyatakan oleh Atwood—boleh mewujudkan ralat sistematik yang tidak dapat diatasi dengan mudah walaupun oleh seni bina canggih seperti Claude.

Kebimbangan Etika: Oportunisme lawan Kreativiti

Di luar had teknikal, Atwood menyentuh tentang elemen manusia dalam penggunaan AI. Beliau melabel mereka yang terlalu bergantung kepada AI sebagai "oportunis" yang mencari jalan mudah untuk mengelak daripada ketelitian penciptaan atau penyelidikan yang tulen. Beliau memberi amaran bahawa godaan untuk "menipu" menggunakan kandungan janaan AI yang tidak dapat dikesan merupakan kebimbangan yang semakin meningkat bagi industri yang bergantung kepada intelek dan nuansa manusia.

Bagi pengasas dan profesional teknologi, perbezaan ini adalah sangat penting. Walaupun AI boleh berfungsi sebagai alat produktiviti yang berkuasa, pemerhatian Atwood bahawa "malah orang yang menggunakannya untuk tujuan perniagaan pun perlu menyemaknya" menekankan bahawa pengawasan manusia tetap menjadi komponen yang tidak boleh diabaikan dalam aliran kerja AI. Era AI yang sepenuhnya autonomi dan bebas ralat masih merupakan prospek yang jauh, dan tanggungjawab terhadap kebenaran tetap terletak pada pengguna.

Ringkasan Utama

  • Integriti Data adalah Keutamaan: Prinsip "garbage in, garbage out" kekal sebagai halangan terbesar bagi LLM, kerana model dihadkan oleh kualiti dan kelengkapan data latihannya.
  • Perangkap Halusinasi: Malah model canggih seperti Claude daripada Anthropic boleh gagal dalam pencarian fakta yang mudah jika corak asas dalam data latihannya mengelirukan.
  • Keperluan Pengawasan Manusia: AI harus dilihat sebagai alat yang memerlukan pengesahan berterusan dan bukannya pengganti kepada kepakaran serta pemikiran kritis manusia.