Разрушение ИИ-коллективного разума: как Flint борется с групповым мышлением LLM

Translated for your language. Читать оригинал.

AI-assisted draft.

GyaanSetu Editorial3 дня назад3мин чтения

Разрушение ИИ-коллективного разума: как Flint борется с групповым мышлением LLM

В этой статье

Разрушая ИИ-коллективный разум: как Flint борется с групповым мышлением LLM

Хотя большие языковые модели, такие как ChatGPT и Claude, превосходно справляются с программированием и исследованиями, они все чаще попадают в ловушку предсказуемого «группового мышления». По мере того как основные модели сходятся к высоковероятным, повторяющимся ответам, новый стартап пытается привнести столь необходимую дивергенцию в экосистему генеративного ИИ.

Проблема: эффект «искусственного коллективного разума»

Значительным ограничением в текущей разработке LLM является склонность моделей тяготеть к наиболее статистически вероятному ответу, что приводит к феномену, который исследователи называют «искусственным коллективным разумом» (Artificial Hivemind). В работе, отмеченной наградой NeurIPS, “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)”, была раскрыта эта глубоко укоренившаяся повторяемость.

Исследовательская группа протестировала 25 различных LLM, включая основные американские модели и версии с открытым исходным кодом из Китая. Когда их просили привести метафору для понятия «время», подавляющее большинство из 1250 ответов сводилось к клише вроде «Время — это река» или «Время — это ткач». Это отсутствие разнообразия — не просто странность, а побочный продукт обучения моделей на схожих наборах данных с основной целью максимизации надежности и связности. OpenAI признала, что стремление к новизне иногда может приводить к менее качественным и менее надежным ответам, поэтому большинство моделей по умолчанию выдают безопасные, «высоковероятные» результаты.

Появление Flint: приоритет разнообразия над предсказуемостью

Австралийский стартап Springboards бросает вызов этому статус-кво с помощью своей новой модели — Flint. В отличие от основных моделей, которые любой ценой борются с галлюцинациями, генеральный директор Springboards Pip Bingemann утверждает, что определенная степень непредсказуемой дивергенции необходима для творческих задач.

В практических тестах разница в распределении результатов очевидна:

Случайность: Когда их просили назвать случайное число, ChatGPT и Claude часто выбирали «7», в то время как Flint выдавал высокоточные нестандартные числа, такие как «3,7916».
Креативный брендинг: На запрос придумать слоган для New Balance Claude и ChatGPT выдали «Run your way», тогда как Flint предложил иной вариант: «Built to last, run to win».
Выбор существительных: Там, где основные модели склоняются к «безопасным» брендам, таким как Toyota или Honda, Flint демонстрирует более широкий диапазон, выбирая менее предсказуемые варианты, например, Ford F-150.

Креативный инструмент для профессионалов

Springboards не просто создает отдельную модель; они разрабатывают специализированный инструмент для специалистов в области рекламы и маркетинга. Платформа позволяет пользователям агрегировать результаты работы нескольких моделей — включая ChatGPT и Claude — и комбинировать их для синтеза новых идей. Flint служит «креативной катапультой» внутри этой экосистемы, специально разработанной для того, чтобы выводить пользователей за рамки их привычных ментальных моделей.

Зои Скаман, директор по стратегии в 77X, отметила, что в то время как основные модели часто предлагают одни и те же избитые решения (например, «обучение финансовой грамотности в игровой форме»), Flint обеспечивает радикальную смену перспективы, предлагая, к примеру, полный ребрендинг самой концепции накопления богатства.

Основные выводы

Однородность LLM: Основные модели сходятся к схожим, предсказуемым ответам из-за использования похожих методологий обучения, что создает эффект «искусственного коллективного разума».
Подход Flint: Модель Flint от Springboards отдает приоритет разнообразию и дивергенции ответов, что делает ее более подходящей для мозгового штурма и разработки креативных стратегий, чем стандартные модели.
Компромисс с надежностью: Индустрия сталкивается с фундаментальным противоречием между надежностью модели (удержание в рамках высокой вероятности) и творческой новизной (использование менее вероятных, разнообразных результатов).

Разрушение ИИ-коллективного разума: как Flint борется с групповым мышлением LLM

Разрушая ИИ-коллективный разум: как Flint борется с групповым мышлением LLM

Проблема: эффект «искусственного коллективного разума»

Появление Flint: приоритет разнообразия над предсказуемостью

Креативный инструмент для профессионалов

Основные выводы

Продолжить чтение

Ян Лекун предупреждает о надвигающемся пузыре для OpenAI и Anthropic

Новый бенчмарк AA Briefcase выявляет трудности ИИ с выполнением реальных интеллектуальных задач

Сэм Альтман утверждает, что скептики масштабирования сдерживали развитие ИИ

Почему LLM с трудом имитируют разнообразие человеческих аргументов

Преодоление группового мышления LLM: как Springboards переосмысливает креативность ИИ