Tác nhân lập trình cục bộ trên macOS

📅2 hours ago⏱1 min read

Tác nhân lập trình cục bộ trên macOS

Bạn có thể chạy một tác nhân lập trình cục bộ trên bất kỳ máy Mac chạy chip Apple Silicon nào. Thiết lập này giúp giữ cho mã nguồn của bạn được riêng tư và chạy trên phần cứng của chính bạn.

Dưới đây là cách thiết lập:

Cài đặt các thành phần phụ thuộc Bạn cần cài đặt Python. Chạy các lệnh sau để cài đặt các thư viện MLX:

pip install mlx mlx-lm mlx-vlm

Hoặc sử dụng uv:

uv tool install mlx-lm && uv tool install mlx-vlm

Chọn một mô hình Sử dụng mlx-community trên Hugging Face để tìm các mô hình như Gemma, Llama, hoặc Qwen. Tên mô hình tuân theo định dạng: {name}-{size}-{instruction tuned}-{precision}.

Nếu bạn gặp khó khăn trong việc lựa chọn, hãy sử dụng công cụ tôi đã xây dựng cho MacOS này: https://github.com/ruarfff/help-pick-local-model

Khởi chạy máy chủ cục bộ Chạy máy chủ bằng mô hình bạn đã chọn. Tôi sử dụng cổng 7777 để tránh xung đột.

mlx_lm.server --model mlx-community/gemma-4-26B-A4B-it-OptiQ-4bit --port 7777

Đối với các mô hình xử lý cả hình ảnh và văn bản, hãy sử dụng mlx_vlm thay thế:

mlx_vlm.server --model mlx-community/gemma-4-12B-it-OptiQ-4bit --port 7777

Kết nối các công cụ của bạn Trỏ tác nhân lập trình của bạn đến máy chủ cục bộ.

Đối với GitHub Copilot CLI: Tạo một hàm shell trong tệp .zshrc hoặc .bashrc để đặt provider thành OpenAI và base URL thành http://127.0.0.1:7777/v1.

Đối với OpenCode: Cập nhật tệp ~/.config/opencode/opencode.json để bao gồm thông tin chi tiết về mô hình và MLX provider cục bộ của bạn.

Đối với Pi: Cập nhật tệp ~/.pi/agent/models.json với cấu hình provider cục bộ.

Chạy các mô hình cục bộ giúp bạn kiểm soát môi trường phát triển của mình.

Nguồn: https://dev.to/ruarfff/local-coding-agent-on-macos-2gga

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi

Tác nhân lập trình cục bộ trên macOS

Continue reading

Thiết lập hệ thống AI RAG cục bộ với tích hợp IDE JetBrains

𝗟𝗼𝗰𝗮𝗹 𝗟𝗟𝗠𝘀 𝗮𝗿𝗲 𝗶𝗻 𝟮𝟬𝟮𝟲, 𝗯𝘂𝘁 𝘁𝗵𝗲 𝗗𝗲𝘃 𝗘𝘅𝗽𝗲𝗿𝗶𝗲𝗻𝗰𝗲 𝗶𝘀 𝗦𝘁𝘂𝗰𝗸 𝗶𝗻 𝟮𝟬𝟭𝟬

𝗟𝗼𝗰𝗮𝗹 𝗟𝗟𝗠𝘀 𝗶𝗻 𝟮𝟬𝟮𝟲 𝗯𝘂𝘁 𝗗𝗲𝘃 𝗘𝘅𝗽𝗲𝗿𝗶𝗲𝗻𝗰𝗲 𝗶𝗻 𝟮𝟬𝟭𝟬

Xây dựng công cụ Review Code AI cục bộ với Ollama

Chạy các mô hình AI cục bộ hiện đã trở thành hiện thực