FastFlowLMを使用したAMD NPU上でのLLM実行：Fedoraガイド

Translated for your language. 原文を読む.

AI-assisted draft.

FastFlowLMを使用してAMD NPUでLLMを実行する - Fedoraガイド

Fedoraを使用して、AMD NPU上で大規模言語モデル（LLM）を直接実行できるようになりました。このガイドでは、Ryzen AI Max 390チップを搭載したASUS ROG Flow Z13で、スタックをセットアップする方法を説明します。

セットアップには、4つの動作レイヤーが必要です：

Fedoraにはこれら用のビルド済みパッケージがないため、ソースからビルドする必要があります。

⚠️ 開始前の重要な修正事項

IOMMUを有効にする多くのユーザーがGPUのチューニングのためにIOMMUを無効にしていますが、これを行うとNPUが動作しなくなります。設定を確認してください： cat /proc/cmdline もし amd_iommu=off が表示された場合は、/etc/default/grub からそれを削除し、grub設定を再生成して再起動してください。
Memlockを無制限に設定する NPUにはロックされたメモリが必要です。制限を確認してください： ulimit -l もし無制限（unlimited）でない場合は、/etc/security/limits.d/99-memlock.conf に以下を追加してください：

xrt-smiのパスを修正する xrt-smiをシンボリックリンクにしないでください。内部スクリプトが壊れてしまいます。代わりにラッパーを使用してください： sudo tee /usr/local/bin/xrt-smi <<'EOF'

#!/bin/sh exec /opt/xilinx/xrt/bin/xrt-smi "$@" EOF sudo chmod +x /usr/local/bin/xrt-smi

ビルド手順の概要

依存関係のインストール: dnf を使用して git、dkms、cmake、および各種開発ライブラリをインストールします。
XRTのビルド: xdna-driver リポジトリをクローンします。Fedora用の cmake3 ラッパーを作成し、RPMをビルドしてインストールします。
NPUプラグインのインストール: xdna-driver リポジトリから xrt_plugin をビルドし、生成されたRPMをインストールします。
FastFlowLMのビルド: FastFlowLM リポジトリをクローンし、cmake を使用してビルドおよびインストールします。

検証コマンド

カーネルとNPUを確認する： flm validate

ハードウェアを確認する： xrt-smi examine xrt-smi validate

モデルを実行する： flm run gemma4-it:e4b

パフォーマンス・ベンチマーク (Ryzen AI Max 390)

オプションの学習コミュニティ: https://t.me/GyaanSetuAi

続きを読む