Een lokale coding agent draaien op een Mac Mini

Translated for your language. Read the original.

AI-assisted draft.

4 uur geleden2min read

Een lokale coding agent draaien op een Mac Mini

Ik gebruik een lokale coding agent voor taken met een laag risico. Het verzorgt bestandswijzigingen, het repareren van tests en build-verificatie. Het schrijft ook Playwright-tests, voert code reviews uit en voert deploys uit.

De setup draait op een Mac Mini M4 met 24 GB RAM. Ik gebruik geen cloud-API's voor het programmeerwerk. Ik gebruik alleen een goedkoop cloud-model voor planning en routing. Een coding agent genaamd Pi verzorgt de eigenlijke bestandswijzigingen. Deze maakt verbinding met oMLX, wat een lokale LLM-server is.

Deze setup werkt met elke agent die een OpenAI-compatibele API gebruikt. Je kunt Claude Code of Codex gebruiken met dezelfde oMLX-server.

Ik gebruik twee modellen en wissel ze af op basis van de taak. De limiet van 24 GB RAM voorkomt dat ik ze tegelijkertijd kan draaien.

Primair coding-model: 9B-klasse met 20 tokens per seconde.
Snel model: 4B-klasse met 27 tokens per seconde voor snelle fixes.

Een swap-script verwijdert het ene model en laadt het andere model in. Dit proces duurt 5 seconden.

De agent voert deze taken uit:

Bestandswijzigingen en refactoring
Schrijven en repareren van tests
Build-verificatie
Code reviews
Documentatie-updates
Het uitvoeren van deploys

Ik gebruik de RPC-modus voor alles wat complexer is dan een enkele regel code. De orchestratielaag schrijft een prompt en Pi voert deze uit.

Ik gebruik deze tools om de prestaties te verbeteren:

pix-optimizer: Comprimeert tokens en verwijdert boilerplate.
context-mode: Routeert workspace-taken en beheert tool-aanroepen.
pi-subagents: Voert taken parallel uit.
pi-workflow-engine: Beheert takenreeksen met meerdere stappen.
pi-mcp-adapter: Maakt verbinding met externe tools via MCP.

Belangrijke regels voor deze setup:

Laad slechts één model tegelijk om geheugenfouten te voorkomen.
Schakel 'thinking mode' uit om de snelheid te behouden.
Stuur geen volledige chatgeschiedenis mee in prompts, anders crasht het model.
Gebruik de RPC-modus voor niet-triviale taken om veiligheidscontroles over te slaan.
Probeer de eerste aanvraag opnieuw na een modelwissel als deze een timeout geeft.

Setup-script: curl -fsSL https://workswithagents.dev/static/setup-local-llm-pi.sh | sh

Bron: https://dev.to/vystartasv/running-a-local-coding-agent-on-a-mac-mini-the-actual-setup-47bo

Optionele leercommunity: https://t.me/GyaanSetuAi

Een lokale coding agent draaien op een Mac Mini

Continue reading

𝗟𝗼𝗰𝗮𝗹 𝗖𝗼𝗱𝗶𝗻𝗴 𝗔𝗴𝗲𝗻𝘁 𝗼𝗻 𝗠𝗮𝗰𝗢𝗦

Draai DeepSeek lokaal met Ollama

𝗥𝘂𝗻𝗻𝗶𝗻𝗴 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹𝘀 𝗟𝗼𝗰𝗮𝗹𝗹𝘆 𝗳𝗼𝗿 𝗖𝗼𝗱𝗶𝗻𝗴

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗮 𝗦𝗮𝗳𝗲 𝗟𝗼𝗰𝗮𝗹 𝗔𝗜 𝗖𝗼𝗱𝗶𝗻𝗴 𝗔𝗴𝗲𝗻𝘁 𝘄𝗶𝘁𝗵 𝗡𝗼𝗱𝗲.𝗷𝘀

𝗟𝗼𝗰𝗮𝗹 𝗖𝗼𝗱𝗶𝗻𝗴 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗔𝗻 𝗘𝗻𝘃𝗶𝗿𝗼𝗻𝗺𝗲𝗻𝘁 𝗣𝗿𝗼𝗯𝗹𝗲𝗺