𝗠𝗲𝗻𝗴𝗮𝗽𝗮 𝗦𝗸𝗼𝗿 𝗞𝗲𝗽𝗲𝗿𝗰𝗮𝘆𝗮𝗮𝗻 𝗔𝗜 𝗔𝗻𝗱𝗮 𝗕𝗲𝗿𝗯𝗼𝗵𝗼𝗻𝗴
Anda telah melatih model Anda. Metriknya terlihat bagus. Anda telah menerapkannya.
Enam bulan kemudian, ada yang salah. Dasbor akurasi Anda terlihat baik-baik saja, tetapi model tersebut gagal.
Ini terjadi karena pergeseran distribusi (distribution shift). Data di produksi berbeda dengan data pelatihan Anda. Pergeseran ini merusak kalibrasi.
Jika Anda menggunakan arsitektur Mixture-of-Experts (MoE), Anda menghadapi risiko khusus.
Kalibrasi berarti jika sebuah model mengatakan ia 80% percaya diri, ia benar sebanyak 80% dari waktu yang ada. Pada model MoE dengan soft routing, hal ini rusak secara diam-diam.
Soft routing mencampurkan beberapa ahli (experts) untuk mendapatkan hasil. Meskipun setiap ahli sudah terkalibrasi, skor gabungannya menjadi tidak dapat diandalkan saat data input berubah. Pola routing yang berbeda muncul yang tidak dilihat model selama pelatihan.
Hard routing lebih tangguh (robust). Ia mengirimkan input hanya ke satu ahli. Kepercayaan tetap terikat pada ahli spesifik tersebut.
Cara memperbaikinya:
- Gunakan Adversarial Reweighting: Latih model Anda pada contoh-contoh yang sulit (hard examples). Gunakan exponential tilt untuk menekankan contoh dengan loss tinggi selama pelatihan.
- Gunakan Robust Filtered Loss: Fokuskan pelatihan pada kasus di mana campuran ahli berkinerja lebih buruk daripada satu ahli tunggal.
Apa yang harus dilakukan sekarang:
- Pantau Expected Calibration Error (ECE): Lacak apakah skor kepercayaan Anda sesuai dengan akurasi aktual Anda.
- Plot Reliability Diagrams: Perhatikan kurva yang melengkung menjauh dari garis diagonal.
- Lacak Input Drift: Gunakan pengujian seperti Kolmogorov-Smirnov untuk melihat apakah data produksi Anda telah berubah.
- Gunakan Temperature Scaling: Ini adalah perbaikan cepat untuk memperbaiki skor kepercayaan setelah penerapan, meskipun ini bukan solusi permanen.
Kalibrasi adalah properti sistem. Bagian-bagian yang terkalibrasi tidak selalu menghasilkan keseluruhan yang terkalibrasi.
Pernahkah Anda menghadapi pergeseran kalibrasi (calibration drift) di produksi? Beritahu saya pengaturan pemantauan Anda di kolom komentar.
Komunitas belajar opsional: https://t.me/GyaanSetuAi