От явного CoT к неявному CoT

Модели ИИ решают сложные задачи, рассуждая шаг за шагом. Этот процесс называется Chain of Thought или CoT.

Большинство моделей используют Explicit CoT. Они прописывают каждую мысль перед тем, как дать ответ. Это замедляет работу модели. Также это расходует много токенов.

Новые исследования показывают более эффективный путь. Модели могут переходить к Implicit CoT. Это означает, что модель интернализирует этапы рассуждения. Она прорабатывает логику, не записывая каждое слово.

Этот сдвиг меняет принципы работы ИИ. Он делает модели быстрее и эффективнее.

Как это работает:

Обучение модели интернализации этих этапов требует специфических данных и методов. Это помогает модели сохранять точность, снижая при этом стоимость генерации.

За этой областью стоит внимательно следить. Эффективные рассуждения — это следующий шаг для больших языковых моделей.

Источник: https://dev.to/paperium/from-explicit-cot-to-implicit-cot-learning-to-internalize-cot-step-by-step-b59

Опциональное обучающее сообщество: https://t.me/GyaanSetuAi