Tiga Pusingan Latihan Membina Chatbot

Membina Transformer sahaja tidak mencukupi. Anda boleh memasukkan seluruh kandungan internet ke dalamnya dan membelanjakan jutaan ringgit untuk pengkomputeran. Anda tetap akan berakhir dengan mesin yang tidak dapat menjawab soalan mudah.

Model mentah hanyalah peniru teks. Ia meramalkan perkataan seterusnya berdasarkan corak. Jika anda bertanya "Bagaimana cara saya menetapkan semula penghala saya?", ia mungkin menjawab dengan lebih banyak soalan seperti "Bagaimana cara saya menukar kata laluan saya?". Ia tidak tahu anda memerlukan bantuan. Ia hanya tahu bagaimana internet menyambung sesuatu ayat.

Untuk menukarkan peramal ini menjadi chatbot, anda memerlukan tiga pusingan latihan.

  1. Pra-latihan (Enjin) Anda menunjukkan trilion perkataan kepada model tersebut. Anda menyembunyikan perkataan terakhir dan memintanya meneka. Ini membina pengetahuan. Ia mempelajari fakta, tatabahasa, dan logik. Ini berfungsi kerana data melabel dirinya sendiri. Skala menjadikan perkara ini boleh diramal. Lebih banyak data dan lebih banyak pengkomputeran membawa kepada hasil yang lebih baik.

  2. Penalaan Arahan (Skrip) Model asas mengetahui segalanya tetapi tidak mempunyai matlamat. Dalam pusingan ini, anda menunjukkan beberapa ribu contoh prompt yang dipasangkan dengan respons manusia yang baik. Ini tidak menambah pengetahuan baharu. Ia mengajar model tingkah laku baharu. Anda seolah-olah menyerahkan skrip kepada seorang pelakon. Ia belajar untuk bertindak seperti pembantu yang membantu dan bukannya sekadar pelengkap teks.

  3. Penalaan Keutamaan (Adab) Skrip adalah terhad. Anda tidak boleh menulis peraturan untuk setiap situasi. Dalam pusingan ini, anda menunjukkan dua jawapan yang berbeza kepada model dan membiarkan manusia memilih yang lebih baik. Model tersebut belajar untuk mengejar skor tinggi berdasarkan cita rasa manusia. Ini memberikan model tersebut nada, kesopanan, dan had keselamatannya.

Ringkasannya mudah:

  • Pra-latihan membina pengetahuan.
  • Penalaan arahan memilih pembantu daripada orang ramai.
  • Penalaan keutamaan menambah pertimbangan dan adab.

Personaliti yang anda lihat dalam tetingkap sembang hanyalah lapisan nipis di atas peramal perkataan mentah. Kita tidak memerlukan teori kecerdasan untuk membina ini. Kita hanya memerlukan matlamat yang mudah, skala, dan dua pusingan bimbingan.

Sumber: https://dev.to/karthi_raman_02ec8161bda0/three-rounds-of-training-turn-a-word-predictor-into-a-chatbot-none-of-them-are-magic-395i

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi