RAM — це новий GPU

📅3 hours ago⏱2 min read

ОЗП — це новий GPU

Роками розробники ШІ зосереджувалися на одному: швидкості обчислень. Ви дивилися на ядра CUDA та тактову частоту.

Ця ера минула.

Новим «вузьким місцем» є обсяг пам'яті.

Моделі з 70 мільярдами параметрів потрібно приблизно 48–50 ГБ пам'яті для стабільної роботи. Nvidia RTX 5090 має лише 32 ГБ.

Математика проста. Якщо ваги вашої моделі не вміщуються у VRAM, ви отримуєте нуль токенів на секунду. Швидкість не має значення, якщо модель не може завантажитися.

Порівняємо залізо:

• RTX 5090: 32 ГБ VRAM за $62,47 за ГБ. • Mac Studio M3 Ultra: 512 ГБ пам'яті за $18,55 за ГБ.

Mac Studio пропонує у 16 разів більший обсяг і коштує у 3,4 раза дешевше за гігабайт.

Різниця полягає в архітектурі. Nvidia використовує дискретну VRAM. Дані мають передаватися між CPU та GPU через шину. Це сповільнює все, коли моделі стають великими.

Apple використовує уніфіковану пам'ять. CPU та GPU використовують один і той самий фізичний простір. Не потрібно переміщувати дані туди-сюди. Дані вже там.

Це змінює ваш робочий процес:

Жодного мапінгу пристроїв.
Жодних складних прапорців розподілу.
Жодного головного болю з кількома GPU.

Якщо ви хочете запустити модель на 70 млрд параметрів, RTX 5090 не впорається. Mac Studio — впорається.

Якщо ви хочете запустити DeepSeek V3, RTX 5090 «задихнеться». Mac Studio завантажить її, маючи ще чимало вільного місця.

Вибір тепер очевидний:

Якщо ваша модель менша за 32 ГБ: Використовуйте Nvidia. Вона швидша для малих моделей.
Якщо ваша модель більша за 32 ГБ: Використовуйте Mac Studio. Nvidia не може запускати такі моделі без величезних витрат або втрати якості.

Збірка потужної системи на Nvidia для великих моделей часто перетворюється на дорогий проєкт на вихідні. Зрештою, вам доводиться купувати кілька GPU та кастомне охолодження, просто щоб утримати систему на плаву.

Mac Studio просто стоїть на вашому столі. Він споживає менше енергії та працює одразу.

Досить питати, який GPU найшвидший. Почніть питати, яка платформа насправді запускає моделі, які вам потрібні.

Який ваш поточний сетап? Ви використовуєте Nvidia чи вже перейшли на уніфіковану пам'ять?

Джерело: https://dev.to/tyson_cung/ram-is-the-new-gpu-why-mac-studio-wins-for-local-llm-inference-3e3b

Додаткова спільнота для навчання: https://t.me/GyaanSetuAi

RAM — це новий GPU

Continue reading

NVIDIA N1X: Зсув у бік ШІ-ПК

𝗪𝗵𝘆 𝗜 𝗖𝗵𝗼𝘀𝗲 𝗧𝗮𝘂𝗿𝗶 𝗢𝘃𝗲𝗿 𝗘𝗹𝗲𝗰𝘁𝗿𝗼𝗻 𝗳𝗼𝗿 𝗠𝘆 𝗟𝗼𝗰𝗮𝗹 𝗔𝗜 𝗗𝗲𝘃 𝗧𝗼𝗼𝗹

𝗪𝗵𝘆 𝗜 𝗖𝗵𝗼𝘀𝗲 𝗧𝗮𝘂𝗿𝗶 𝗢𝘃𝗲𝗿 𝗘𝗹𝗲𝗰𝘁𝗿𝗼𝗻

𝗟𝗹𝗮𝗺𝗮.𝗰𝗽𝗽 𝗡𝗼𝘄 𝗠𝗮𝘁𝗰𝗵𝗲𝘀 𝘃𝗟𝗟𝗠 𝗦𝗽𝗲𝗲𝗱

𝗡𝘃𝗶𝗱𝗶𝗮 𝗗𝗚𝗫 𝗦𝗽𝗮𝗿𝗸: 𝗔 𝗧𝗼𝗼𝗹 𝗙𝗼𝗿 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿𝘀