Запуск локального кодинг-агента на Mac Mini

Я використовую локального кодинг-агента для завдань з низьким рівнем ризику. Він займається редагуванням файлів, виправленням тестів та перевіркою збірки. Він також пише тести Playwright, проводить рев'ю коду та запускає деплої.

Ця конфігурація працює на Mac Mini M4 з 24 ГБ оперативної пам'яті. Я не використовую хмарні API для написання коду. Я використовую дешеву хмарну модель лише для планування та маршрутизації. Кодинг-агент на ім'я Pi займається безпосереднім редагуванням файлів. Він підключається до oMLX, який є локальним LLM-сервером.

Ця система працює з будь-яким агентом, що використовує OpenAI-сумісний API. Ви можете використовувати Claude Code або Codex з цим самим сервером oMLX.

Я використовую дві моделі та перемикаю їх залежно від завдання. Обмеження у 24 ГБ оперативної пам'яті не дозволяє мені запускати їх одночасно.

  • Основна модель для кодингу: клас 9B зі швидкістю 20 токенів на секунду.
  • Швидка модель: клас 4B зі швидкістю 27 токенів на секунду для швидких виправлень.

Скрипт перемикання вивантажує одну модель і завантажує іншу. Цей процес займає 5 секунд.

Агент виконує такі завдання:

  • Редагування файлів та рефакторинг
  • Написання та виправлення тестів
  • Перевірка збірки
  • Рев'ю коду
  • Оновлення документації
  • Запуск деплоїв

Я використовую RPC-режим для всього, що складніше за один рядок коду. Шар оркестрації пише промпт, а Pi його виконує.

Я використовую ці інструменти для підвищення продуктивності:

  • pix-optimizer: стискає токени та видаляє шаблонний код (boilerplate).
  • context-mode: маршрутизує завдання робочого простору та керує викликами інструментів.
  • pi-subagents: запускає завдання паралельно.
  • pi-workflow-engine: обробляє багатоетапні послідовності завдань.
  • pi-mcp-adapter: підключається до зовнішніх інструментів через MCP.

Важливі правила для цієї конфігурації:

  • Завантажуйте лише одну модель за раз, щоб уникнути помилок пам'яті.
  • Вимкніть режим роздумів (thinking mode), щоб зберегти швидкість.
  • Не надсилайте повну історію чату в промптах, інакше модель вийде з ладу.
  • Використовуйте RPC-режим для нетривіальних завдань, щоб обійти засоби контролю безпеки.
  • Повторіть перший запит після перемикання моделі, якщо він перерветься за тайм-аутом.

Скрипт налаштування: curl -fsSL https://workswithagents.dev/static/setup-local-llm-pi.sh | sh

Джерело: https://dev.to/vystartasv/running-a-local-coding-agent-on-a-mac-mini-the-actual-setup-47bo

Додаткова спільнота для навчання: https://t.me/GyaanSetuAi