Niliendesha LLM Ndani ya ASUS ROG Ally Yangu

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialsiku 3 zilizopita2min read

Niliendesha LLM Ndani ya ASUS ROG Ally Yangu

Nilijaribu kuendesha LLM Ndani ya ASUS ROG Ally Yangu

Nilijaribu kuendesha modeli ya AI ndani ya ASUS ROG Ally yangu kwa wiki chache. Nilidhani ingekuwa mradi wa kufurahisha. Badala yake, ikawa somo kuhusu mipaka ya vifaa (hardware).

Sikuitumia kama mbadala wa wingu (cloud). Niliitumia kama kifaa maalum kwa kazi ndogo ndogo. Hapa kuna nilichojifunza kuhusu kuendesha AI kwenye vifaa vya mkononi (handheld hardware).

Kikwazo cha Kumbukumbu

Vifaa vya mkononi hutumia Unified Memory Architecture. Hii ina maana kwamba CPU na GPU zinashiriki RAM moja. Kwa kawaida, GPU hupata sehemu ndogo sana ya kumbukumbu.

Ikiwa modeli yako haitoshi katika sehemu hiyo, mfumo hutumia CPU. Hii hufanya uzalishaji (generation) kuwa wa polepole sana kiasi cha kuchosha.

Suluhisho:

Ingia kwenye BIOS yako.
Ongeza UMA frame buffer kwa mkono.
Niliongeza yangu hadi 4 GB. Mabadiliko haya yalisaidia zaidi kuliko marekebisho mengine yoyote.

Kile Ambacho Hakifanyi Kazi

Nilijaribu kutumia zRAM ili kupata nafasi zaidi kwenye kumbukumbu yangu. Ilishindwa. Model nyingi za AI hutumia faili za GGUF ambazo tayari zimesimbiwa. Huwezi kuzisimba zaidi ili kupata nafasi.

Pia nilijaribu kutumia disk swap ili kusaidia. Swap haifanyi mambo kuwa ya haraka. Inafanya yawe hayawezi

Niliendesha LLM Ndani ya ASUS ROG Ally Yangu

Continue reading

𝗧𝗵𝗲 𝗥𝗶𝗴𝗵𝗍 𝗪𝗮𝘆 𝗧𝗼 𝗕𝗎𝗶𝗹𝗱 𝗔𝗡 𝗔𝗜 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝗍𝗎𝗿𝗲

𝗛𝗼𝘄 𝗜 𝗖𝘂𝘁 𝗢𝘂𝗿 𝗔𝗜 𝗔𝗣𝗜 𝗕𝗶𝗹𝗹 𝗶𝗻 𝗛𝗮𝗹𝗳 𝗪𝗵𝗶𝗹𝗲 𝗛𝗶𝘁𝘁𝗶𝗻𝗴 𝗽𝟵𝟵 𝗦𝗟𝗔𝘀

𝗚𝗶𝘃𝗶𝗻𝗴 𝗔𝗴𝗲𝗻𝘁𝗚𝗮𝘁𝗲𝘄𝗮𝘆 𝗮 𝗦𝗲𝗺𝗮𝗻𝘁𝗶𝗰 𝗕𝗿𝗮𝗶𝗻

Je, AI yako inaonekana kuwa polepole? Labda siyo kwamba haina akili.

Local AI: How to Run Open Source Models Locally