𝗥𝗔𝗠 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗚𝗣𝗨

📅3 hours ago⏱2 min read

RAM Yeni GPU Oldu

Yıllardır yapay zeka geliştiricileri tek bir şeye odaklandı: hesaplama hızı. CUDA çekirdeklerine ve saat hızlarına bakıyordunuz.

Bu dönem sona erdi.

Yeni darboğaz bellek kapasitesi.

70 milyar parametreli bir modelin iyi çalışması için yaklaşık 48 ila 50 GB belleğe ihtiyacı vardır. Nvidia RTX 5090 ise sadece 32 GB'a sahip.

Matematik basit. Eğer model ağırlıklarınız VRAM'e sığmıyorsa, saniyede sıfır token alırsınız. Model yüklenemiyorsa hızın bir önemi yoktur.

Donanımı karşılaştıralım:

• RTX 5090: GB başına 62,47 $ ile 32 GB VRAM. • Mac Studio M3 Ultra: GB başına 18,55 $ ile 512 GB bellek.

Mac Studio 16 kat daha fazla kapasite sunuyor ve gigabayt başına 3,4 kat daha ucuza geliyor.

Fark mimariden kaynaklanıyor. Nvidia ayrık (discrete) VRAM kullanır. Verilerin CPU ve GPU arasında bir köprü üzerinden hareket etmesi gerekir. Modeller büyüdüğünde bu durum her şeyi yavaşlatır.

Apple birleşik bellek (unified memory) kullanır. CPU ve GPU aynı fiziksel alanı paylaşır. Verilerin bir o yana bir bu yana taşınmasına gerek yoktur. Veri zaten oradadır.

Bu, iş akışınızı değiştirir:

Cihaz eşleme (device mapping) yok.
Karmaşık dağıtım bayrakları (distribution flags) yok.
Çoklu GPU baş ağrıları yok.

70B bir model çalıştırmak istiyorsanız, RTX 5090 başarısız olur. Mac Studio ise çalışır.

DeepSeek V3 çalıştırmak istiyorsanız, RTX 5090 tıkanır. Mac Studio ise onu fazlasıyla yer kalacak şekilde yükler.

Seçim artık net:

Modeliniz 32 GB'ın altındaysa: Nvidia kullanın. Küçük modeller için daha hızlıdır.
Modeliniz 32 GB'ın üzerindeyse: Mac Studio kullanın. Nvidia bu modelleri devasa maliyetler veya kalite kaybı olmadan çalıştıramaz.

Büyük modeller için üst düzey bir Nvidia sistemi kurmak genellikle pahalı bir hafta sonu projesine dönüşür. Ayakta kalabilmek için sonunda birden fazla GPU ve özel soğutma sistemi satın almak zorunda kalırsınız.

Bir Mac Studio masanızda durur. Daha az güç tüketir ve anında çalışmaya hazırdır.

Hangi GPU'nun en hızlı olduğunu sormayı bırakın. Hangi platformun ihtiyacınız olan modelleri gerçekten çalıştırdığını sormaya başlayın.

Sizin kurulumunuz ne durumda? Nvidia mı kullanıyorsunuz yoksa birleşik belleğe mi geçtiniz?

Kaynak: https://dev.to/tyson_cung/ram-is-the-new-gpu-why-mac-studio-wins-for-local-llm-inference-3e3b

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi

𝗥𝗔𝗠 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗚𝗣𝗨

Continue reading

NVIDIA N1X: Yapay Zeka PC Dönüşümü

𝗪𝗵𝘆 𝗜 𝗖𝗵𝗼𝘀𝗲 𝗧𝗮𝘂𝗿𝗶 𝗢𝘃𝗲𝗿 𝗘𝗹𝗲𝗰𝘁𝗿𝗼𝗻 𝗳𝗼𝗿 𝗠𝘆 𝗟𝗼𝗰𝗮𝗹 𝗔𝗜 𝗗𝗲𝘃 𝗧𝗼𝗼𝗹

𝗪𝗵𝘆 𝗜 𝗖𝗵𝗼𝘀𝗲 𝗧𝗮𝘂𝗿𝗶 𝗢𝘃𝗲𝗿 𝗘𝗹𝗲𝗰𝘁𝗿𝗼𝗻

𝗟𝗹𝗮𝗺𝗮.𝗰𝗽𝗽 𝗡𝗼𝘄 𝗠𝗮𝘁𝗰𝗵𝗲𝘀 𝘃𝗟𝗟𝗠 𝗦𝗽𝗲𝗲𝗱

𝗡𝘃𝗶𝗱𝗶𝗮 𝗗𝗚𝗫 𝗦𝗽𝗮𝗿𝗸: 𝗔 𝗧𝗼𝗼𝗹 𝗙𝗼𝗿 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿𝘀