𝗚𝗼𝗼𝗴𝗹𝗲 𝗧𝗵𝗮𝘆 Đổ𝗶 𝗩𝗶̃𝗻𝗵 𝗩𝗶𝗲̂𝗻 𝗖𝗮́𝗰𝗵 𝗧𝗮̣𝗼 𝗔𝗜
Các mô hình AI tiêu chuẩn tạo văn bản theo từng từ một. Phương pháp này rất chậm. Mỗi từ mới đều yêu cầu một lượt truyền toàn bộ qua mạng lưới. Điều này tạo ra một nút thắt cổ chai.
Google DeepMind đã tạo ra DiffusionGemma để giải quyết vấn đề này. Nó sử dụng cơ chế discrete text diffusion. Nó hoạt động bằng cách tinh chỉnh các khối văn bản lớn cùng một lúc.
Các tính năng chính của DiffusionGemma:
- Parallel Generation: Mô hình tinh chỉnh toàn bộ các khối văn bản cùng một lúc. Nó không hoạt động theo trình tự từ trái sang phải.
- Tốc độ nhanh hơn gấp 4 lần: Google báo cáo tốc độ nhanh hơn tới 4 lần trên các GPU.
- Mixture of Experts: Mô hình sử dụng 3.8B tham số cho mỗi bước từ một backbone 26B tham số.
Mô hình này sử dụng kiến trúc encoder-decoder. Nó sửa lỗi các token trên một digital canvas trong thời gian thực.
Bạn có thể sử dụng nó ngay bây giờ. Nó sử dụng giấy phép Apache 2.0. Nó hoạt động với Hugging Face Transformers và vLLM.
Liệu các mô hình khuếch tán có thay thế việc mở rộng AI truyền thống không? Hay chúng sẽ chỉ phục vụ nhu cầu tạo nhanh? Hãy chia sẻ suy nghĩ của bạn.
Nguồn: https://dev.to/incredibleheck/google-just-killed-autoregressive-ai-generation-diffusiongemma-36io
Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi