Запуск локального кодинг-агента на Mac Mini
Я використовую локального кодинг-агента для завдань з низьким рівнем ризику. Він займається редагуванням файлів, виправленням тестів та перевіркою збірки. Він також пише тести Playwright, проводить рев'ю коду та запускає деплої.
Ця конфігурація працює на Mac Mini M4 з 24 ГБ оперативної пам'яті. Я не використовую хмарні API для написання коду. Я використовую дешеву хмарну модель лише для планування та маршрутизації. Кодинг-агент на ім'я Pi займається безпосереднім редагуванням файлів. Він підключається до oMLX, який є локальним LLM-сервером.
Ця система працює з будь-яким агентом, що використовує OpenAI-сумісний API. Ви можете використовувати Claude Code або Codex з цим самим сервером oMLX.
Я використовую дві моделі та перемикаю їх залежно від завдання. Обмеження у 24 ГБ оперативної пам'яті не дозволяє мені запускати їх одночасно.
- Основна модель для кодингу: клас 9B зі швидкістю 20 токенів на секунду.
- Швидка модель: клас 4B зі швидкістю 27 токенів на секунду для швидких виправлень.
Скрипт перемикання вивантажує одну модель і завантажує іншу. Цей процес займає 5 секунд.
Агент виконує такі завдання:
- Редагування файлів та рефакторинг
- Написання та виправлення тестів
- Перевірка збірки
- Рев'ю коду
- Оновлення документації
- Запуск деплоїв
Я використовую RPC-режим для всього, що складніше за один рядок коду. Шар оркестрації пише промпт, а Pi його виконує.
Я використовую ці інструменти для підвищення продуктивності:
- pix-optimizer: стискає токени та видаляє шаблонний код (boilerplate).
- context-mode: маршрутизує завдання робочого простору та керує викликами інструментів.
- pi-subagents: запускає завдання паралельно.
- pi-workflow-engine: обробляє багатоетапні послідовності завдань.
- pi-mcp-adapter: підключається до зовнішніх інструментів через MCP.
Важливі правила для цієї конфігурації:
- Завантажуйте лише одну модель за раз, щоб уникнути помилок пам'яті.
- Вимкніть режим роздумів (thinking mode), щоб зберегти швидкість.
- Не надсилайте повну історію чату в промптах, інакше модель вийде з ладу.
- Використовуйте RPC-режим для нетривіальних завдань, щоб обійти засоби контролю безпеки.
- Повторіть перший запит після перемикання моделі, якщо він перерветься за тайм-аутом.
Скрипт налаштування:
curl -fsSL https://workswithagents.dev/static/setup-local-llm-pi.sh | sh
Джерело: https://dev.to/vystartasv/running-a-local-coding-agent-on-a-mac-mini-the-actual-setup-47bo
Додаткова спільнота для навчання: https://t.me/GyaanSetuAi