Probably Mengumpul $9 Juta untuk Menangani Halusinasi LLM dengan Kejuruteraan Jitu

Memandangkan Model Bahasa Besar (LLM) semakin disepadukan ke dalam aliran kerja profesional, industri kini menghadapi rintangan yang berterusan: kecenderungan model yang paling canggih sekalipun untuk berhalusinasi. Syarikat pemula Probably menangani cabaran ini secara langsung, dengan memperoleh $9 juta dalam pembiayaan awal yang diterajui oleh Andreessen Horowitz untuk membina pendekatan yang lebih ketat dan deterministik terhadap kebolehpercayaan AI.

Misi utama Probably, yang diterajui oleh pengasas Peter Elias, adalah untuk merapatkan jurang antara sifat probabilistik LLM dan piawaian ketepatan 99.99% yang diharapkan daripada sistem deterministik. Dalam persekitaran berisiko tinggi, satu kesilapan fakta boleh menjadikan alat AI tidak berguna. Untuk menyelesaikan masalah ini, Probably beralih daripada idea bahawa ketepatan hanyalah fungsi saiz model dan sebaliknya memberi tumpuan kepada "kejuruteraan harness".

Produk utama syarikat ini ialah alat sains data yang direka untuk mengekstrak cerapan daripada set data yang kompleks. Tidak seperti bot sembang standard yang memberikan respons perbualan, alat Probably menyediakan setiap jawapan dengan petikan khusus dan jejak audit yang telus, membolehkan pengguna mengesahkan logik di sebalik setiap output.

Seni Bina "Data Science Mech Suit"

Daripada hanya bergantung kepada keupayaan penaakulan model yang besar, Probably menggunakan apa yang dipanggil Elias sebagai "data science mech suit". Seni bina ini berfungsi sebagai sistem harness yang rumit di mana output awal LLM akan diperiksa dengan teliti oleh pengesah deterministik.

Jika LLM menghasilkan keputusan yang tidak selaras sepenuhnya dengan set data asas, pengesah tersebut akan menolaknya. Yang paling penting, LLM dilatih secara khusus terhadap pengesah ini, mewujudkan sistem gelung tertutup yang dioptimumkan untuk kelajuan dan integriti fakta. Pendekatan ini beroperasi berdasarkan prinsip asas: dengan memperhalusi konteks dan mengurangkan kekaburan melalui kejuruteraan, anda boleh memaksa model untuk "melakukan perkara yang betul" tanpa memerlukan kuasa pengkomputeran kasar yang besar.

Kecekapan Melalui Model Tempatan yang Lebih Kecil

Salah satu implikasi teknikal yang paling ketara bagi pendekatan Probably ialah keupayaan untuk menggunakan model yang lebih kecil dan lebih cekap. Oleh kerana "mech suit" mengendalikan tugas berat pengesahan dan pemurnian konteks, sistem ini boleh beroperasi pada model yang "empat kelas lebih lemah daripada model perintis".

Peralihan ini memberikan manfaat ekonomi dan operasi yang besar:

Mencabar Model Insentif Makmal AI Besar

Elias menunjukkan ketidakselarasan struktur dalam landskap AI semasa: makmal AI utama mempunyai insentif untuk membina model tujuan umum yang besar yang memerlukan pembetulan pengguna yang kerap. Memandangkan makmal-makmal ini sering mengenakan caj berdasarkan penggunaan token, lebih banyak ralat dan pertanyaan susulan sebenarnya boleh meningkatkan hasil pendapatan. Dengan memberi tumpuan kepada ketepatan dan "mengurangkan kekaburan" melalui kejuruteraan dan bukannya skala, Probably sedang membina niche untuk aplikasi AI misi-kritikal di mana kebolehpercayaan adalah satu-satunya metrik yang penting.

Rumusan Utama