Masalah Sumber Kebenaran

Pasukan AI perusahaan menghadapi satu soalan yang sukar.

"Apakah jawapan yang betul?"

Soalan ini bukan datang daripada model. Ia datang daripada perniagaan.

Pada skala kecil, ini terasa mudah. Pada skala perusahaan, ia menjadi masalah seni bina yang besar. Kebanyakan syarikat tidak mempunyai satu sumber kebenaran. Mereka mempunyai banyak sumber.

Syarikat menggunakan banyak sistem:

  • CRM
  • ERP
  • Sistem tiket
  • Pangkalan data dalaman
  • Spreadsheet
  • Platform dokumentasi

Setiap sistem menyimpan data. Setiap sistem berubah mengikut masa. Seorang pelanggan mungkin wujud di tiga tempat berbeza dengan tiga status yang berbeza.

AI tidak mencipta masalah ini. Ia mendedahkannya.

Sebelum adanya AI, manusia mengendalikan data yang tidak teratur. Pekerja tahu laporan mana yang sudah lama. Mereka tahu pangkalan data mana yang boleh dipercayai.

AI kekurangan intuisi ini. Apabila AI menarik data daripada pelbagai sumber, ia melihat setiap versi kebenaran secara serentak.

Jika satu sistem menyatakan pelanggan adalah "Aktif" dan satu lagi menyatakan "Digantung", AI akan menemui jalan buntu. Tiada sistem yang rosak. Masalahnya adalah pemilikan.

Kesilapan biasa adalah berfikir bahawa lebih banyak data akan menambah baik AI. Sering kali, lebih banyak data mewujudkan lebih banyak kekeliruan. Lebih banyak integrasi membawa kepada lebih banyak pertindihan dan lebih banyak konflik.

Sistem retrieval mencari data yang relevan. Ia tidak mencari data yang berautoriti.

Anda mesti memutuskan:

  • Sistem manakah yang memiliki status pelanggan?
  • Sistem manakah yang memiliki harga?
  • Sistem manakah yang memiliki inventori?

Keputusan ini adalah di bawah tadbir urus, bukan algoritma.

Untuk membetulkan perkara ini, anda mesti menetapkan hierarki sumber. Tidak semua sistem adalah sama. Anda mesti melabelkannya:

  • Sumber utama
  • Sumber sekunder
  • Sumber sandaran

Ini menghapuskan tekaan. Infrastruktur menentukan kebenaran sebelum model sempat melihat data tersebut.

Kejayaan AI perusahaan lebih bergantung kepada tadbir urus berbanding pemilihan model. Jika anda tidak menetapkan pemilikan, anda akan menghadapi:

  • Jawapan yang tidak konsisten
  • Keputusan yang bercanggah
  • Automasi yang tidak boleh dipercayai
  • Kepercayaan pengguna yang rendah

Jika pengguna melihat AI mengubah keputusannya, mereka akan berhenti menggunakannya.

Berhenti menganggap AI sebagai masalah retrieval. Mula menganggapnya sebagai masalah pemilikan data.

Soalan yang paling sukar bukanlah apa yang patut dijawab oleh model. Soalan yang paling sukar ialah apa yang sebenarnya benar.

Source: https://dev.to/karan2598/the-source-of-truth-problem-every-enterprise-ai-team-faces-2m2k

Optional learning community: https://t.me/GyaanSetuAi