Mwongozo wa Fedora wa Kuendesha LLM kwenye AMD NPU kwa kutumia FastFlowLM

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialsiku 6 zilizopita2min read

Mwongozo wa Fedora wa Kuendesha LLM kwenye AMD NPU kwa kutumia FastFlowLM

Kuendesha LLMs kwenye AMD NPU kwa kutumia FastFlowLM - Mwongozo wa Fedora

Sasa unaweza kuendesha Large Language Models moja kwa moja kwenye AMD NPU yako ukitumia Fedora. Mwongozo huu unakuonyesha jinsi ya kuweka mfumo (stack) kwenye ASUS ROG Flow Z13 yenye chip ya Ryzen AI Max 390.

Usanidi unahitaji tabaka nne zinazofanya kazi:

Kernel + DKMS driver (amdxdna): Hutengeneza device node na kupakia firmware.
XRT base: AMD runtime.
XRT NPU plugin: Inaruhusu XRT kuiona NPU.
FastFlowLM (flm): Zana inayozalisha mifano (models).

Kwa kuwa Fedora haina vifurushi vilivyotengenezwa tayari (prebuilt packages) kwa ajili ya hili, lazima ujenge kutoka kwenye chanzo (source).

⚠️ Marekebisho Muhimu Kabla ya Kuanza

Washa IOMMU W

Mwongozo wa Fedora wa Kuendesha LLM kwenye AMD NPU kwa kutumia FastFlowLM

Continue reading

𝗧𝘄𝗲𝗻𝘁𝘆 𝗬𝗲𝗮𝗿𝘀 𝗼𝗳 𝗟𝗶𝗻𝘂𝘅, 𝗮𝗻𝗱 𝗡𝗼𝘄 𝗜 𝗥𝘂𝗻 𝗠𝘆 𝗢𝘄𝗻 𝗔𝗜

Run GLM 5.2 Locally on Your Desktop

API yako ya kwanza ya LLM kwenye Kubernetes

Local AI: How to Run Open Source Models Locally