Google na zawsze zmienia generowanie AI
Standardowe modele AI generują tekst słowo po słowie. Ta metoda jest powolna. Każde nowe słowo wymaga pełnego przejścia przez sieć. Tworzy to wąskie gardło.
Google DeepMind stworzyło DiffusionGemma, aby rozwiązać ten problem. Wykorzystuje ono dyskretną dyfuzję tekstu. Działa poprzez jednoczesne dopracowywanie dużych bloków tekstu.
Kluczowe cechy DiffusionGemma:
- Równoległe generowanie: Model jednocześnie dopracowuje całe bloki tekstu. Nie działa on od lewej do prawej.
- 4-krotnie wyższe prędkości: Google raportuje prędkości do 4 razy wyższe na procesorach GPU.
- Mixture of Experts: Model wykorzystuje 3,8 mld parametrów na krok z 26-miliardowego szkieletu (backbone).
Model ten wykorzystuje architekturę encoder-decoder. Poprawia tokeny na cyfrowym płótnie w czasie rzeczywistym.
Możesz go używać już teraz. Korzysta z licencji Apache 2.0. Działa z Hugging Face Transformers oraz vLLM.
Czy modele dyfuzyjne zastąpią tradycyjne skalowanie AI? Czy będą służyć jedynie potrzebom szybkiego generowania? Podziel się swoimi przemyśleniami.
Źródło: https://dev.to/incredibleheck/google-just-killed-autoregressive-ai-generation-diffusiongemma-36io
Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi