Google навсегда меняет генерацию ИИ

Стандартные модели ИИ генерируют текст по одному слову за раз. Этот метод медленный. Каждое новое слово требует полного прохода через нейросеть, что создает «узкое место».

Google DeepMind создала DiffusionGemma для решения этой проблемы. Она использует дискретную диффузию текста, работая путем одновременного уточнения больших блоков текста.

Ключевые особенности DiffusionGemma:

  • Параллельная генерация: модель одновременно уточняет целые блоки текста, а не работает последовательно слева направо.
  • Скорость в 4 раза выше: Google сообщает об ускорении на GPU до 4 раз.
  • Mixture of Experts: модель использует 3,8 млрд параметров за шаг из backbone-модели объемом 26 млрд параметров.

Эта модель использует архитектуру encoder-decoder. Она корректирует токены на цифровом «холсте» в режиме реального времени.

Вы можете использовать её уже сейчас. Она доступна по лицензии Apache 2.0 и работает с Hugging Face Transformers и vLLM.

Заменят ли диффузионные модели традиционное масштабирование ИИ? Или они будут использоваться только для задач быстрой генерации? Поделитесь своим мнением.

Источник: https://dev.to/incredibleheck/google-just-killed-autoregressive-ai-generation-diffusiongemma-36io

Опциональное обучающее сообщество: https://t.me/GyaanSetuAi