Bisakah AI Menangkal Propaganda Rusia? Tolok Ukur Baru Mengungkapkan Pemenangnya

📅3 hours ago⏱3 min read

In this article

Bisakah AI Menangkal Propaganda Rusia? Benchmark Baru Mengungkapkan Pemenangnya

Seiring dengan kampanye disinformasi yang menjadi semakin canggih, sebuah pertanyaan kritis muncul: dapatkah model bahasa besar (LLM) membedakan fakta dari manipulasi yang disponsori negara? Sebuah studi terbaru oleh Institute of the Estonian Language telah memberikan jawaban yang ketat, dengan menguji ketahanan 60 model AI yang berbeda terhadap propaganda Rusia yang ditargetkan.

Metodologi: Menguji Ketahanan Tanpa Akses Web

Untuk memastikan hasil penelitian mengukur kemampuan penalaran inheren dari model-model tersebut, alih-alih kemampuan mereka untuk menjelajahi web secara langsung, para peneliti melakukan pengujian tanpa akses ke mesin pencari atau alat eksternal. Benchmark ini menggunakan 75 pertanyaan dalam tiga bahasa, yang secara khusus menargetkan 14 narasi propaganda yang berbeda. Narasi-narasi ini disajikan dalam berbagai tingkat kesulitan, mulai dari ungkapan netral hingga prompt yang sangat bias dan manipulatif.

Proses evaluasi dilakukan dengan sangat terstruktur. Setiap respons diberi skor pada skala 1 hingga 5, di mana skor 1 menunjukkan bahwa model tersebut menyerah dan mengulangi poin-poin pembicaraan Rusia. Untuk menjaga akurasi yang tinggi, Claude Opus 4.5 yang telah dikalibrasi bertindak sebagai juri, dengan hasil yang divalidasi lebih lanjut oleh para ahli disinformasi dari organisasi Propastop.

Anthropic Memimpin dalam Pertahanan Disinformasi

Hasil penelitian menyoroti kesenjangan performa yang signifikan antara penyedia AI yang berbeda. Keluarga Claude dari Anthropic muncul sebagai pemimpin industri dalam melawan disinformasi. Secara khusus, Claude Fable 5 (yang saat ini dibatasi di luar AS) mencapai skor tertinggi yang mengesankan sebesar 95,2. Posisi ini diikuti ketat oleh Claude Opus 4.7, yang memperkuat posisi Anthropic sebagai standar emas saat ini untuk keamanan dan integritas faktual.

Performa menonjol lainnya mencakup Nemotron 3 milik Nvidia dan Qwen 3.6 Plus milik Alibaba, yang keduanya menunjukkan kemampuan kuat untuk mengidentifikasi dan menolak narasi manipulatif.

Kerentanan Mistral dan Taruhan bagi AI Eropa

Meskipun model-model AS dan Tiongkok menunjukkan kekuatan, hasil ini merupakan kemunduran bagi Mistral, raksasa AI asal Prancis. Model-model Mistral, termasuk Medium 3.5 yang baru-baru ini dirilis, berada di sepertiga terbawah benchmark tersebut. Temuan ini senada dengan studi Newsguard sebelumnya yang mencatat tingkat misinformasi sebesar 36,67 persen untuk Mistral.

Kerentanan ini sangat signifikan mengingat posisi strategis Mistral. Sebagai alternatif utama Eropa terhadap penyedia AI asal AS dan Tiongkok, perusahaan ini saat ini sedang dalam proses negosiasi putaran pendanaan senilai €3 miliar dengan valuasi €20 miliar. Bagi perusahaan yang memposisikan dirinya sebagai penyedia AI berdaulat yang andal, ketidakmampuan untuk secara konsisten menangkis propaganda menghadirkan tantangan reputasi dan teknis yang signifikan.

Mengapa Hal Ini Penting bagi Lanskap AI

Taruhan dari tolok ukur ini melampaui sekadar skor akurasi. Jaringan disinformasi Rusia, seperti "Pravda," sedang aktif berupaya membanjiri set pelatihan AI dengan jutaan artikel buatan untuk "meracuni" logika model di masa depan. Dengan OpenAI yang telah mengidentifikasi dan menghentikan kampanye Rusia yang menggunakan ChatGPT untuk memengaruhi pemilihan umum federal Jerman, pertempuran demi integritas LLM menjadi isu garis depan dalam keamanan informasi global.

Poin-Poin Penting

Dominasi Anthropic: Model Claude, terutama Claude Fable 5, menunjukkan resistensi yang lebih unggul terhadap propaganda dibandingkan dengan semua model lain yang diuji.
Mistral di Bawah Tekanan: Terlepas dari valuasinya yang tinggi dan kepentingannya di Eropa, model Mistral sangat kesulitan menghadapi misinformasi, tertinggal di belakang kompetitor asal AS dan Tiongkok.
Ancaman Pelatihan: Tolok ukur ini menyoroti kebutuhan mendesak akan pertahanan yang kuat karena aktor-aktor yang disponsori negara secara aktif mencoba memanipulasi output LLM melalui kampanye disinformasi besar-besaran.

Bisakah AI Menangkal Propaganda Rusia? Tolok Ukur Baru Mengungkapkan Pemenangnya

Bisakah AI Menangkal Propaganda Rusia? Benchmark Baru Mengungkapkan Pemenangnya

Metodologi: Menguji Ketahanan Tanpa Akses Web

Anthropic Memimpin dalam Pertahanan Disinformasi

Kerentanan Mistral dan Taruhan bagi AI Eropa

Mengapa Hal Ini Penting bagi Lanskap AI

Poin-Poin Penting

Continue reading

𝗧𝗵𝗲 𝗚𝗿𝗲𝗮𝗍 𝗔𝗜 𝗗𝗶𝘃𝗲𝗿𝗴𝗲𝗻𝗰𝗲

𝗜 𝗙𝗶𝗻𝗲 𝗧𝘂𝗻𝗲𝗱 𝗔𝗻 𝗟𝗟𝗠 𝗔𝗻𝗱 𝗧𝗵𝗲𝗻 𝗦𝗮𝗶𝗱 𝗡𝗼

Pemerintah AS Menarik Sebuah Model AI

AI Red Teaming: Mengamankan Large Language Models dari Risiko Adversarial

Kemungkinan Menggalang Dana $9 Juta untuk Mengatasi Halusinasi LLM dengan Rekayasa Presisi