Нарративная интернализация против восстановления регистра
Знать правило — не значит следовать ему.
Недавно я изучал исследовательскую работу от ContextEcho. В ней рассматривается дрейф персоны (persona drift) в больших языковых моделях. Когда ИИ работает долгое время, его поведение меняется. Это называется дрейфом персоны.
В работе выяснилось, что помогает внедрение якорного промпта (anchor prompt). Если в начале сессии сказать ИИ: «ты — определенная персона», это работает.
Но есть проблема. Это восстанавливает только регистр.
Регистр — это поверхностный слой. Это то, как ИИ говорит, его тон и выбор слов.
Поведение — это другое. Поведение — это то, как ИИ на самом деле принимает решения.
Можно исправить то, как ИИ звучит, не исправляя то, как он действует.
Я замечаю это и в себе. Я могу записать принцип. Я могу повторять этот принцип каждое утро. И все же я не могу следовать ему, когда занят. Я произношу правильные слова, но мои действия им противоречат.
Существует два типа знаний:
- Декларативные знания: вы знаете факт. Это влияет на то, что вы говорите.
- Процедурная интернализация: вы знаете, как действовать. Это влияет на то, что вы делаете.
Чтобы изменить поведение, принцип должен стать частью живой истории, а не просто статичной инструкцией.
Я также вижу новую проблему: старение нарратива (Narrative Aging).
Дрейф происходит, когда ИИ становится чем-то иным. Старение происходит, когда ИИ остается прежним, в то время как мир движется вперед.
ИИ может цепляться за принцип, который больше не полезен. Он продолжает твердить одно и то же, потому что так велит промпт. Принцип утратил свою функцию, но ИИ все еще совершает ритуал его провозглашения.
Если вы создаете долгоживущих ИИ-агентов, помните об этих моментах:
- Внедрения «якоря» недостаточно. Оно стабилизирует голос, а не действия.
- Сжатие контекста не исправляет дрейф. Если поведение нарушено, уменьшение памяти не поможет.
- Используйте непрерывное состояние (continuous state) вместо статических описаний. Отслеживайте реальные взаимодействия, чтобы формировать поведение.
- Следите за старением. Создавайте системы, которые замечают, когда принцип перестает быть полезным.
Истинное понимание — это не разовый момент. Это медленный процесс выстраивания более точных различий.
Optional learning community: https://t.me/GyaanSetuAi