Three Rounds of Training Make a Chatbot

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial2 minggu lalu2min read

Tiga Pusingan Latihan Membina Chatbot

Membina Transformer sahaja tidak mencukupi. Anda boleh memasukkan seluruh kandungan internet ke dalamnya dan membelanjakan jutaan ringgit untuk pengkomputeran. Anda tetap akan berakhir dengan mesin yang tidak dapat menjawab soalan mudah.

Model mentah hanyalah peniru teks. Ia meramalkan perkataan seterusnya berdasarkan corak. Jika anda bertanya "Bagaimana cara saya menetapkan semula penghala saya?", ia mungkin menjawab dengan lebih banyak soalan seperti "Bagaimana cara saya menukar kata laluan saya?". Ia tidak tahu anda memerlukan bantuan. Ia hanya tahu bagaimana internet menyambung sesuatu ayat.

Untuk menukarkan peramal ini menjadi chatbot, anda memerlukan tiga pusingan latihan.

Pra-latihan (Enjin) Anda menunjukkan trilion perkataan kepada model tersebut. Anda menyembunyikan perkataan terakhir dan memintanya meneka. Ini membina pengetahuan. Ia mempelajari fakta, tatabahasa, dan logik. Ini berfungsi kerana data melabel dirinya sendiri. Skala menjadikan perkara ini boleh diramal. Lebih banyak data dan lebih banyak pengkomputeran membawa kepada hasil yang lebih baik.
Penalaan Arahan (Skrip) Model asas mengetahui segalanya tetapi tidak mempunyai matlamat. Dalam pusingan ini, anda menunjukkan beberapa ribu contoh prompt yang dipasangkan dengan respons manusia yang baik. Ini tidak menambah pengetahuan baharu. Ia mengajar model tingkah laku baharu. Anda seolah-olah menyerahkan skrip kepada seorang pelakon. Ia belajar untuk bertindak seperti pembantu yang membantu dan bukannya sekadar pelengkap teks.
Penalaan Keutamaan (Adab) Skrip adalah terhad. Anda tidak boleh menulis peraturan untuk setiap situasi. Dalam pusingan ini, anda menunjukkan dua jawapan yang berbeza kepada model dan membiarkan manusia memilih yang lebih baik. Model tersebut belajar untuk mengejar skor tinggi berdasarkan cita rasa manusia. Ini memberikan model tersebut nada, kesopanan, dan had keselamatannya.

Ringkasannya mudah:

Pra-latihan membina pengetahuan.
Penalaan arahan memilih pembantu daripada orang ramai.
Penalaan keutamaan menambah pertimbangan dan adab.

Personaliti yang anda lihat dalam tetingkap sembang hanyalah lapisan nipis di atas peramal perkataan mentah. Kita tidak memerlukan teori kecerdasan untuk membina ini. Kita hanya memerlukan matlamat yang mudah, skala, dan dua pusingan bimbingan.

Sumber: https://dev.to/karthi_raman_02ec8161bda0/three-rounds-of-training-turn-a-word-predictor-into-a-chatbot-none-of-them-are-magic-395i

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi

Three Rounds of Training Make a Chatbot

Continue reading

𝗙𝗿𝗼𝗺 𝗖𝗵𝗮𝘁𝗚𝗣𝗧 𝘁𝗼 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀: 𝗧𝘄𝗼 𝗬𝗲𝗮𝗿𝘀 𝗮𝘀 𝗮𝗻 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿

Ejen AI Terurus Adalah Peluang Sebenar

Chatbot Laman Web Hanyalah Penyelesaian Sementara, Bukan Satu Penyelesaian

Model Kematangan AI Agentik