Google na zawsze zmienia generowanie AI

Translated for your language. Read the original.

AI-assisted draft.

przedwczoraj1min read

Standardowe modele AI generują tekst słowo po słowie. Ta metoda jest powolna. Każde nowe słowo wymaga pełnego przejścia przez sieć. Tworzy to wąskie gardło.

Google DeepMind stworzyło DiffusionGemma, aby rozwiązać ten problem. Wykorzystuje ono dyskretną dyfuzję tekstu. Działa poprzez jednoczesne dopracowywanie dużych bloków tekstu.

Kluczowe cechy DiffusionGemma:

Równoległe generowanie: Model jednocześnie dopracowuje całe bloki tekstu. Nie działa on od lewej do prawej.
4-krotnie wyższe prędkości: Google raportuje prędkości do 4 razy wyższe na procesorach GPU.
Mixture of Experts: Model wykorzystuje 3,8 mld parametrów na krok z 26-miliardowego szkieletu (backbone).

Model ten wykorzystuje architekturę encoder-decoder. Poprawia tokeny na cyfrowym płótnie w czasie rzeczywistym.

Możesz go używać już teraz. Korzysta z licencji Apache 2.0. Działa z Hugging Face Transformers oraz vLLM.

Czy modele dyfuzyjne zastąpią tradycyjne skalowanie AI? Czy będą służyć jedynie potrzebom szybkiego generowania? Podziel się swoimi przemyśleniami.

Źródło: https://dev.to/incredibleheck/google-just-killed-autoregressive-ai-generation-diffusiongemma-36io

Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi

Google na zawsze zmienia generowanie AI

Continue reading

Naprawianie halucynacji AI

𝗗𝗶𝗳𝗳𝘂𝘀𝗶𝗼𝗻𝗚𝗲𝗺𝗺𝗮: 𝗚𝗼𝗼𝗴𝗹𝗲'𝘀 𝗢𝗽𝗲𝗻 𝗔𝗜 𝗧𝘄𝗶𝘀𝘁

𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠𝘀 𝗖𝗵𝗮𝗻𝗴𝗲 𝗔𝗜 𝗖𝗼𝗱𝗲 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻

DiffusionGemma 26B: Równoległe generowanie tekstu

𝗗𝗶𝗳𝗳𝘂𝘀𝗶𝗼𝗻𝗚𝗲𝗺𝗺𝗮: 𝟭,𝟬𝟬𝟬 𝗧𝗼𝗸𝗲𝗻𝘀 𝗣𝗲𝗿 𝗦𝗲𝗰𝗼𝗻𝗱