𝗟𝗟𝗠 𝗣𝗿𝗼𝗺𝗽𝘁 𝗜𝗻𝗷𝗲𝗰𝘁𝗶𝗼𝗻 𝗮𝗻𝗱 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹 𝗦𝗲𝗰𝘂𝗿𝗶𝘁𝘆 (Injeksi Prompt LLM dan Keamanan Guardrail)

LLM tidak memiliki batasan yang jelas antara instruksi dan data. Segala sesuatu dalam jendela konteks adalah satu aliran token. Injeksi prompt terjadi ketika data penyerang bertindak sebagai instruksi. Anda tidak bisa hanya mengandalkan penyaringan untuk mencapai keamanan. Anda harus mengelolanya dengan pertahanan berlapis (defense-in-depth).

Kegagalan pertahanan umum:

Penyelundupan ASCII (ASCII Smuggling) adalah ancaman besar. Teknik ini menggunakan karakter tak terlihat seperti Tag Unicode atau spasi lebar nol (zero-width spaces) untuk menyembunyikan instruksi. Model membacanya, tetapi manusia tidak melihat apa pun. Hal ini memungkinkan pemalsuan identitas (identity spoofing) dan eksfiltrasi data melalui email atau kalender.

Cara melindungi aplikasi Anda:

Keamanan adalah celah pada alur kerja (pipeline), bukan sekadar celah pada model. Perbaikannya terletak pada kode aplikasi Anda.

Sumber: https://dev.to/geekaara/llm-prompt-injection-guardrail-security-glm

Komunitas pembelajaran opsional: https://t.me/GyaanSetuAi