Bagaimana Model AI Sebenarnya Bekerja

Anda menggunakan AI untuk menulis email atau memperbaiki kode. Kebanyakan orang menyebutnya algoritma. Mereka tidak tahu bagaimana cara kerjanya. Prosesnya sederhana untuk dipahami meskipun matematikanya rumit.

Ide intinya adalah prediksi.

Jika Anda mengetik "The cat sat on the," model akan memprediksi kata berikutnya. Ia memilih "mat" karena kata tersebut memiliki probabilitas tinggi. Ia mengulangi loop ini kata demi kata untuk membangun kalimat lengkap. Untuk memprediksi kata dengan baik, model mempelajari tata bahasa, fakta, dan logika.

Berikut adalah empat langkahnya:

  1. Token Model tidak membaca kata. Mereka membaca angka. Mereka memecah teks menjadi potongan-potongan kecil yang disebut token. Setiap token menjadi daftar angka. Di balik setiap percakapan, matematika terjadi dalam skala masif.

  2. Pelatihan (Training) Pelatihan adalah cara model belajar. Anda memperlihatkan miliaran halaman dari buku dan situs web kepadanya. Model memprediksi sebuah token dan memeriksa jawabannya. Jika salah, sistem akan menyesuaikan pengaturan internalnya. Ia melakukan ini triliunan kali. Tidak ada manusia yang menulis aturan untuknya. Model menemukan pola dengan sendirinya.

  3. Atensi (Attention) Ini membantu model memahami konteks. Dalam kalimat "The trophy did not fit in the suitcase because it was too big," kata "it" merujuk pada trofi. Atensi memberi tahu model kata-kata sebelumnya mana yang paling penting. Ini memungkinkan model untuk melacak makna di sepanjang paragraf yang panjang.

  4. Fine-tuning Model mentah hanyalah mesin prediksi. Fine-tuning mengajarkan mereka untuk menjadi asisten. Manusia memberi peringkat pada jawaban tersebut. Model belajar untuk memberikan respons yang bermanfaat dan aman berdasarkan peringkat ini.

Apa yang terjadi saat Anda menekan kirim?

Teks Anda berubah menjadi angka. Angka-angka tersebut bergerak melalui lapisan matematika. Model menghitung probabilitas untuk token berikutnya. Ia memilih sebuah token dan mengulangi proses tersebut hingga balasannya selesai. Ini terjadi dalam hitungan detik.

AI bukanlah sihir. Ini adalah prediksi dalam skala masif. Mengetahui hal ini membuat Anda menjadi pengguna alat yang lebih baik.

Source: https://dev.to/rameshkumarramu/ai-models-how-do-they-actually-work-2kmm

Optional learning community: https://t.me/GyaanSetuAi