Kwa nini GPU hupiku CPU katika Mafunzo ya AI

Kwa nini huwezi tu kutengeneza CPU kubwa zaidi kwa ajili ya AI?

Ni swali la kawaida. Watu wengi hudhani GPU hushinda kwa sababu ni za haraka zaidi. Sababu halisi inahusu usanifu. CPU na GPU hutatua matatizo tofauti.

Mafunzo ya AI kwa kiasi kikubwa ni kuzidisha matrisi (matrix multiplication). Unafanya mabilioni ya operesheni za hisabati ambazo hazitegemeani. Hii huitwa kazi sambamba (parallel work).

CPU imetengenezwa kwa ajili ya kazi tata na zisizotabirika. Inatumia silikoni kwa:

Sifa hizi husaidia CPU kushughulikia ombi la wavuti au hoja ya hifadhidata. Lakini kwa ajili ya AI, sifa hizi zinapotea bure. Huhitaji kiini (core) chenye akili ili kuzidisha namba mbili mabilioni ya mara.

GPU huchukua njia tofauti. Inaondoa mitambo tata. Badala ya viini vichache wenye akili, inatumia maelfu ya viini rahisi.

Pengo la vifaa ni kubwa sana:

Ufanisi wa nguvu pia ni tofauti. Kiini cha Xeon kinatumia takriban 1.5W. Kiini cha B300 kinatumia takriban 0.07W. Unalipia gharama kubwa ya nguvu kwa ajili ya akili ya CPU ambayo mafunzo ya AI hayaitumii kamwe.

Upana wa mawasiliano ya kumbukumbu (memory bandwidth) pia ni muhimu.

Maelfu ya viini hayana faida ikiwa yatakuwa bila kazi yakisubiri data. GPU huunganisha viini vingi na kasi kubwa ya kumbukumbu ili viweze kufanya kazi pamoja.

Ukijaribu kuweka viini 20,000 vya CPU kwenye chip moja, utakutana na kikwazo cha nguvu na joto mara moja. Pia ungelipia sifa "janja" ambazo huzihitaji.

Ifikirie hivi:

AI ya kisasa hufanya kazi vizuri zaidi kwa kutumia zote mbili. CPU hufanya kazi kama ubongo wa kusimamia kazi. GPU hufanya kazi kama misuli ya kufanya hesabu nzito.

Chanzo: https://dev.to/ambarish_0221/why-gpus-beat-cpus-for-ai-training-and-why-you-cant-just-build-a-bigger-cpu-3dff

Jumuiya ya hiari ya kujifunza: https://t.me/GyaanSetuAi