𝗣𝗿𝗶𝘃𝗮𝗰𝘆-𝗣𝗿𝗲𝘀𝗲𝗿𝘃𝗶𝗻𝗴 𝗔𝗜 𝗳𝗼𝗿 𝗛𝗲𝗿𝗶𝘁𝗮𝗴𝗲 𝗟𝗮𝗻𝗴𝘂𝗮𝗴𝗲𝘀 -> 𝗔𝗜 𝗜𝗻𝗮𝘆𝗼𝗹𝗶𝗻𝗱𝗮 𝗙𝗮𝗿𝗮𝗴𝗵𝗮 Kwa 𝗔𝗷𝗶𝗹𝗶 𝗬𝗮 𝗟𝘂𝗴𝗵𝗮 𝗭𝗮 𝗨𝗿𝗶𝘁𝗵𝗶
Utafiti wa AI mara nyingi hupuuza upande wa kibinadamu wa data.
Wakati mmoja nilikuwa nimekaa katika maktaba kaskazini mwa Norway. Nilikuwa nikitazama misemo ya maandishi ya mkono ya Sámi. Mzee wa eneo hilo alinifundisha maneno ambayo hayana mbadala wa Kiingereza. Maneno haya yanaelezea theluji, paa (reindeer), na upepo.
Mzee huyo aliniuliza swali gumu: "Je, mashine zenu zinaweza kutusaidia kuifanya lugha yetu iendelee kuishi bila kutunyang'anya?"
Swali hili lilibadilisha utafiti wangu.
Mafunzo mengi ya AI yanahitaji kiasi kikubwa cha data. Data nyingi huenda kwenye seva kuu. Kwa jamii za asili, data ya kilugha ni takatifu. Ni ya faragha. Kutuma sauti ghafi za nyimbo takatifu au nyimbo za kubembeleza za kifamilia kwenye seva ya wingu (cloud server) si chaguo linalokubalika.
Nilitengeneza mfumo mpya wa kutatua hili. Unachanganya privacy-preserving active learning na inverse simulation verification.
Hivi ndivyo inavyofanya kazi:
- Vifaa vya ndani: Jamii huweka sauti na maandishi yao ghafi kwenye vifaa vyao wenyewe.
- Tabaka la faragha: Mfumo huongeza kelele za hisabati (mathematical noise) kwenye data. Hii hulinda utambulisho na muktadha wa wasemaji.
- Muhtasari wa kitakwimu: Badala ya sauti ghafi, mfumo hutuma tu mifumo ya kidhahania kama vile jinsi sauti zinavyofuatana.
- Uigaji wa kinyume (Inverse simulation): Seva hutumia mifumo hii kutengeneza seti ya data ya bandia (synthetic dataset). Seti hii ya data inaiga muundo wa lugha asilia bila kutumia rekodi halisi.
- Ujifunzaji hai (Active learning): Modeli hutambua sehemu mahususi za lugha ambazo inahitaji kujifunza zaidi. Huomba msaada kwa jamii kwa sehemu hizo mahususi tu.
Nilijaribu hili na kikundi cha Sámi nchini Sweden. Walikuwa na saa 120 za sauti. Walitaka mfumo wa kubadilisha sauti kuwa maandishi (speech-to-text) kwa ajili ya watoto wao.
Tuliongoza mfumo huo kwenye Raspberry Pi rahisi. Hakuna sauti ghafi iliyowahi kutoka katika kituo chao cha jamii. Baada ya mizunguko 10 ya mafunzo, modeli ilifikia kiwango cha makosa ya maneno (word error rate) cha 78%. Hii ni ushindi mkubwa kwa seti ndogo ya data.
Mafunzo muhimu kutoka kwa kazi hii:
- Faragha na manufaa si lazima viwe maadui. Inverse simulation inaruhusu yote mawili.
- Modeli ndogo na zenye akili hufanya kazi vizuri zaidi kuliko modeli kubwa kwa lugha adimu.
- Zana za kiufundi lazima ziheshimu kanuni za kitamaduni ili zifanye kazi.
AI inapaswa kutumikia mamlaka ya kitamaduni. Lazima tujenge zana zinazoziruhusu jamii kudhibiti data zao wenyewe.
Jumuiya ya kujifunza ya hiari: https://t.me/GyaanSetuAi