𝗥𝗔𝗠 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗚𝗣𝗨

📅3 hours ago⏱2 min read

𝗥𝗔𝗠 𝗔𝗱𝗮𝗹𝗮𝗵 𝗚𝗣𝗨 𝗕𝗮𝗵𝗮𝗿𝘂

Selama bertahun-tahun, pembangun AI hanya fokus pada satu perkara: kelajuan pengiraan. Anda melihat kepada teras CUDA dan kelajuan jam (clock speeds).

Era itu telah berakhir.

Kekangan (bottleneck) baharu adalah kapasiti memori.

Model dengan 70 bilion parameter memerlukan kira-kira 48 hingga 50 GB memori untuk berjalan dengan lancar. Nvidia RTX 5090 hanya mempunyai 32 GB.

Pengiraannya mudah. Jika pemberat (weights) model anda tidak muat dalam VRAM, anda akan mendapat sifar token sesaat. Kelajuan tidak bermakna jika model tidak dapat dimuatkan.

Bandingkan perkakasan:

• RTX 5090: 32 GB VRAM pada $62.47 setiap GB. • Mac Studio M3 Ultra: 512 GB memori pada $18.55 setiap GB.

Mac Studio menawarkan kapasiti 16x lebih besar dan kos 3.4x lebih murah bagi setiap gigabait.

Perbezaannya terletak pada seni bina. Nvidia menggunakan VRAM diskret. Data mesti bergerak antara CPU dan GPU melalui jambatan (bridge). Ini melambatkan segalanya apabila model menjadi besar.

Apple menggunakan memori bersatu (unified memory). CPU dan GPU berkongsi ruang fizikal yang sama. Tiada pergerakan data ulang-alik. Data tersebut sudah sedia ada di sana.

Ini mengubah aliran kerja anda:

Tiada pemetaan peranti (device mapping).
Tiada bendera pengagihan (distribution flags) yang kompleks.
Tiada sakit kepala multi-GPU.

Jika anda ingin menjalankan model 70B, RTX 5090 gagal. Mac Studio berjaya.

Jika anda ingin menjalankan DeepSeek V3, RTX 5090 akan tersekat. Mac Studio memuatkannya dengan ruang yang mencukupi.

Pilihan kini jelas:

Jika model anda di bawah 32 GB: Gunakan Nvidia. Ia lebih pantas untuk model kecil.
Jika model anda melebihi 32 GB: Gunakan Mac Studio. Nvidia tidak dapat menjalankan model ini tanpa kos yang besar atau kehilangan kualiti.

Membina rig Nvidia kelas atasan untuk model besar sering kali menjadi projek hujung minggu yang mahal. Anda akhirnya terpaksa membeli pelbagai GPU dan sistem penyejukan tersuai hanya untuk memastikan ia berfungsi.

Mac Studio terletak di atas meja anda. Ia menggunakan kurang kuasa dan berfungsi serta-merta.

Berhenti bertanya GPU mana yang paling pantas. Mula bertanya platform mana yang sebenarnya dapat menjalankan model yang anda perlukan.

Di manakah kedudukan persediaan anda? Adakah anda menggunakan Nvidia atau telah beralih kepada memori bersatu?

Sumber: https://dev.to/tyson_cung/ram-is-the-new-gpu-why-mac-studio-wins-for-local-llm-inference-3e3b

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi

𝗥𝗔𝗠 𝗜𝘀 𝗧𝗵𝗲 𝗡𝗲𝘄 𝗚𝗣𝗨

Continue reading

𝗡𝗩𝗜𝗗𝗜𝗔 𝗡𝟭𝗫: 𝗧𝗵𝗲 𝗔𝗜 𝗣𝗖 𝗦𝗵𝗶𝗳𝘁

𝗪𝗵𝘆 𝗜 𝗖𝗵𝗼𝘀𝗲 𝗧𝗮𝘂𝗿𝗶 𝗢𝘃𝗲𝗿 𝗘𝗹𝗲𝗰𝘁𝗿𝗼𝗻 𝗳𝗼𝗿 𝗠𝘆 𝗟𝗼𝗰𝗮𝗹 𝗔𝗜 𝗗𝗲𝘃 𝗧𝗼𝗼𝗹

𝗪𝗵𝘆 𝗜 𝗖𝗵𝗼𝘀𝗲 𝗧𝗮𝘂𝗿𝗶 𝗢𝘃𝗲𝗿 𝗘𝗹𝗲𝗰𝘁𝗿𝗼𝗻

𝗟𝗹𝗮𝗺𝗮.𝗰𝗽𝗽 𝗡𝗼𝘄 𝗠𝗮𝘁𝗰𝗵𝗲𝘀 𝘃𝗟𝗟𝗠 𝗦𝗽𝗲𝗲𝗱

𝗡𝘃𝗶𝗱𝗶𝗮 𝗗𝗚𝗫 𝗦𝗽𝗮𝗿𝗸: 𝗔 𝗧𝗼𝗼𝗹 𝗙𝗼𝗿 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿𝘀