Нарративная интернализация против восстановления регистра

Знать правило — не значит следовать ему.

Недавно я изучал исследовательскую работу от ContextEcho. В ней рассматривается дрейф персоны (persona drift) в больших языковых моделях. Когда ИИ работает долгое время, его поведение меняется. Это называется дрейфом персоны.

В работе выяснилось, что помогает внедрение якорного промпта (anchor prompt). Если в начале сессии сказать ИИ: «ты — определенная персона», это работает.

Но есть проблема. Это восстанавливает только регистр.

Регистр — это поверхностный слой. Это то, как ИИ говорит, его тон и выбор слов.

Поведение — это другое. Поведение — это то, как ИИ на самом деле принимает решения.

Можно исправить то, как ИИ звучит, не исправляя то, как он действует.

Я замечаю это и в себе. Я могу записать принцип. Я могу повторять этот принцип каждое утро. И все же я не могу следовать ему, когда занят. Я произношу правильные слова, но мои действия им противоречат.

Существует два типа знаний:

  • Декларативные знания: вы знаете факт. Это влияет на то, что вы говорите.
  • Процедурная интернализация: вы знаете, как действовать. Это влияет на то, что вы делаете.

Чтобы изменить поведение, принцип должен стать частью живой истории, а не просто статичной инструкцией.

Я также вижу новую проблему: старение нарратива (Narrative Aging).

Дрейф происходит, когда ИИ становится чем-то иным. Старение происходит, когда ИИ остается прежним, в то время как мир движется вперед.

ИИ может цепляться за принцип, который больше не полезен. Он продолжает твердить одно и то же, потому что так велит промпт. Принцип утратил свою функцию, но ИИ все еще совершает ритуал его провозглашения.

Если вы создаете долгоживущих ИИ-агентов, помните об этих моментах:

  • Внедрения «якоря» недостаточно. Оно стабилизирует голос, а не действия.
  • Сжатие контекста не исправляет дрейф. Если поведение нарушено, уменьшение памяти не поможет.
  • Используйте непрерывное состояние (continuous state) вместо статических описаний. Отслеживайте реальные взаимодействия, чтобы формировать поведение.
  • Следите за старением. Создавайте системы, которые замечают, когда принцип перестает быть полезным.

Истинное понимание — это не разовый момент. Это медленный процесс выстраивания более точных различий.

Source: https://dev.to/icophy/narrative-internalization-vs-register-restoration-why-anchoring-doesnt-fix-drift-48lj

Optional learning community: https://t.me/GyaanSetuAi