Разрушая ИИ-коллективный разум: как Flint борется с групповым мышлением LLM
Хотя большие языковые модели, такие как ChatGPT и Claude, превосходно справляются с программированием и исследованиями, они все чаще попадают в ловушку предсказуемого «группового мышления». По мере того как основные модели сходятся к высоковероятным, повторяющимся ответам, новый стартап пытается привнести столь необходимую дивергенцию в экосистему генеративного ИИ.
Проблема: эффект «искусственного коллективного разума»
Значительным ограничением в текущей разработке LLM является склонность моделей тяготеть к наиболее статистически вероятному ответу, что приводит к феномену, который исследователи называют «искусственным коллективным разумом» (Artificial Hivemind). В работе, отмеченной наградой NeurIPS, “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)”, была раскрыта эта глубоко укоренившаяся повторяемость.
Исследовательская группа протестировала 25 различных LLM, включая основные американские модели и версии с открытым исходным кодом из Китая. Когда их просили привести метафору для понятия «время», подавляющее большинство из 1250 ответов сводилось к клише вроде «Время — это река» или «Время — это ткач». Это отсутствие разнообразия — не просто странность, а побочный продукт обучения моделей на схожих наборах данных с основной целью максимизации надежности и связности. OpenAI признала, что стремление к новизне иногда может приводить к менее качественным и менее надежным ответам, поэтому большинство моделей по умолчанию выдают безопасные, «высоковероятные» результаты.
Появление Flint: приоритет разнообразия над предсказуемостью
Австралийский стартап Springboards бросает вызов этому статус-кво с помощью своей новой модели — Flint. В отличие от основных моделей, которые любой ценой борются с галлюцинациями, генеральный директор Springboards Pip Bingemann утверждает, что определенная степень непредсказуемой дивергенции необходима для творческих задач.
В практических тестах разница в распределении результатов очевидна:
- Случайность: Когда их просили назвать случайное число, ChatGPT и Claude часто выбирали «7», в то время как Flint выдавал высокоточные нестандартные числа, такие как «3,7916».
- Креативный брендинг: На запрос придумать слоган для New Balance Claude и ChatGPT выдали «Run your way», тогда как Flint предложил иной вариант: «Built to last, run to win».
- Выбор существительных: Там, где основные модели склоняются к «безопасным» брендам, таким как Toyota или Honda, Flint демонстрирует более широкий диапазон, выбирая менее предсказуемые варианты, например, Ford F-150.
Креативный инструмент для профессионалов
Springboards не просто создает отдельную модель; они разрабатывают специализированный инструмент для специалистов в области рекламы и маркетинга. Платформа позволяет пользователям агрегировать результаты работы нескольких моделей — включая ChatGPT и Claude — и комбинировать их для синтеза новых идей. Flint служит «креативной катапультой» внутри этой экосистемы, специально разработанной для того, чтобы выводить пользователей за рамки их привычных ментальных моделей.
Зои Скаман, директор по стратегии в 77X, отметила, что в то время как основные модели часто предлагают одни и те же избитые решения (например, «обучение финансовой грамотности в игровой форме»), Flint обеспечивает радикальную смену перспективы, предлагая, к примеру, полный ребрендинг самой концепции накопления богатства.
Основные выводы
- Однородность LLM: Основные модели сходятся к схожим, предсказуемым ответам из-за использования похожих методологий обучения, что создает эффект «искусственного коллективного разума».
- Подход Flint: Модель Flint от Springboards отдает приоритет разнообразию и дивергенции ответов, что делает ее более подходящей для мозгового штурма и разработки креативных стратегий, чем стандартные модели.
- Компромисс с надежностью: Индустрия сталкивается с фундаментальным противоречием между надежностью модели (удержание в рамках высокой вероятности) и творческой новизной (использование менее вероятных, разнообразных результатов).
