Anthropic сокращает системный промпт Claude Code на 80% для Fable 5
Anthropic наблюдает смену парадигмы в управлении большими языковыми моделями: переход от тяжеловесных наборов инструкций к более легким и интуитивно понятным руководствам. Эта эволюция обусловлена появлением новых моделей Fable 5 (класса Mythos), которые лучше работают при меньшем количестве ограничений и большем объеме контекста.
Смерть длинных системных промптов
На протяжении многих лет отраслевым стандартом оптимизации производительности ИИ был «промпт-инжиниринг» с использованием массивных системных инструкций и исчерпывающих примеров few-shot. Разработчики верили, что большее количество правил и ограничений в духе «не делай этого» является ключом к надежности. Однако Anthropic меняет этот тренд.
Тарик Шихипар (Tariq Shihipar), технический специалист Anthropic, сообщил, что компания сократила системный промпт для Claude Code на ошеломляющие 80 процентов. Это сокращение — не признак упрощения модели, а скорее ответ на сложные когнитивные способности новых моделей Fable 5. По мере совершенствования моделей традиционный метод «ведения за руку» с помощью длинных промптов становится контрпродуктивным.
Почему модели Fable 5 сопротивляются ограничениям
Переход к моделям Fable 5 (или класса Mythos) представляет собой фундаментальное изменение в поведении моделей. По словам Шихипара, предоставление обширных примеров и жестких правил этим конкретным моделям на самом деле снижает их производительность. Причина неожиданна: эти модели по своей природе более «творческие», чем их предшественники.
Когда разработчик предоставляет длинный список конкретных примеров, это выступает в роли ограничения, сужающего способности модели к рассуждению. Вместо того чтобы искать наиболее эффективное или творческое решение проблемы, модель чувствует необходимость имитировать конкретные паттерны, заданные в промпте. Чтобы раскрыть истинный потенциал класса Mythos, Anthropic отходит от жестких правил в сторону «управления через контекст». Это позволяет модели использовать свои способности к рассуждению для выполнения задач, не будучи зажатой в рамки избыточных инструкций.
Циклическая эволюция промпт-инжиниринга
Путь промпт-инжиниринга по мере развития моделей следовал четкой циклической закономерности. Внутренние исследования Anthropic выделяют три различных этапа разработки моделей:
- Ранние модели: Требовали коротких, узкоспециализированных промптов, подкрепленных множеством примеров и крайне ограничительных инструкций для поддержания хоть какого-то уровня связности.
- Промежуточные модели: По мере улучшения понимания промпты значительно удлинились. Разработчики использовали возросшую способность к «следованию инструкциям», чтобы создавать массивные, сложные системные промпты, управляющие каждым аспектом поведения модели.
- Эра Fable 5: Мы вступили в стадию, когда промпты снова становятся короче. Акцент сместился с того, что именно должна делать модель (правила), на создание необходимой среды (контекста), позволяющей модели действовать автономно.
Это событие знаменует собой важную веху в развитии ИИ. Оно предполагает, что по мере перехода к более агентным моделям, ориентированным на рассуждение, роль разработчика изменится: из «составителя правил» он превратится в «поставщика контекста», где качество информации станет важнее количества инструкций.
Основные выводы
- Сокращение на 80%: Anthropic сократила системный промпт Claude Code на 80%, чтобы лучше соответствовать возможностям моделей Fable 5 (класса Mythos).
- Ограничения подавляют креативность: Избыточные примеры и жесткие правила «не делай этого» могут на самом деле ограничивать способности продвинутых моделей к рассуждению и творчеству.
- Контекст важнее правил: Новые горизонты управления ИИ заключаются в предоставлении богатого контекста, а не длинных наборов ограничительных инструкций.
