Tác nhân lập trình cục bộ trên macOS

Bạn có thể chạy một tác nhân lập trình cục bộ trên bất kỳ máy Mac chạy chip Apple Silicon nào. Thiết lập này giúp giữ cho mã nguồn của bạn được riêng tư và chạy trên phần cứng của chính bạn.

Dưới đây là cách thiết lập:

  1. Cài đặt các thành phần phụ thuộc Bạn cần cài đặt Python. Chạy các lệnh sau để cài đặt các thư viện MLX:

pip install mlx mlx-lm mlx-vlm

Hoặc sử dụng uv:

uv tool install mlx-lm && uv tool install mlx-vlm

  1. Chọn một mô hình Sử dụng mlx-community trên Hugging Face để tìm các mô hình như Gemma, Llama, hoặc Qwen. Tên mô hình tuân theo định dạng: {name}-{size}-{instruction tuned}-{precision}.

Nếu bạn gặp khó khăn trong việc lựa chọn, hãy sử dụng công cụ tôi đã xây dựng cho MacOS này: https://github.com/ruarfff/help-pick-local-model

  1. Khởi chạy máy chủ cục bộ Chạy máy chủ bằng mô hình bạn đã chọn. Tôi sử dụng cổng 7777 để tránh xung đột.

mlx_lm.server --model mlx-community/gemma-4-26B-A4B-it-OptiQ-4bit --port 7777

Đối với các mô hình xử lý cả hình ảnh và văn bản, hãy sử dụng mlx_vlm thay thế:

mlx_vlm.server --model mlx-community/gemma-4-12B-it-OptiQ-4bit --port 7777

  1. Kết nối các công cụ của bạn Trỏ tác nhân lập trình của bạn đến máy chủ cục bộ.

Đối với GitHub Copilot CLI: Tạo một hàm shell trong tệp .zshrc hoặc .bashrc để đặt provider thành OpenAI và base URL thành http://127.0.0.1:7777/v1.

Đối với OpenCode: Cập nhật tệp ~/.config/opencode/opencode.json để bao gồm thông tin chi tiết về mô hình và MLX provider cục bộ của bạn.

Đối với Pi: Cập nhật tệp ~/.pi/agent/models.json với cấu hình provider cục bộ.

Chạy các mô hình cục bộ giúp bạn kiểm soát môi trường phát triển của mình.

Nguồn: https://dev.to/ruarfff/local-coding-agent-on-macos-2gga

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi