𝗙𝗿𝗼𝗺 𝗘𝘅𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧 𝘁𝗼 𝗜𝗺𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧

📅1 hour ago⏱1 min read

От явного CoT к неявному CoT

Модели ИИ решают сложные задачи, рассуждая шаг за шагом. Этот процесс называется Chain of Thought или CoT.

Большинство моделей используют Explicit CoT. Они прописывают каждую мысль перед тем, как дать ответ. Это замедляет работу модели. Также это расходует много токенов.

Новые исследования показывают более эффективный путь. Модели могут переходить к Implicit CoT. Это означает, что модель интернализирует этапы рассуждения. Она прорабатывает логику, не записывая каждое слово.

Этот сдвиг меняет принципы работы ИИ. Он делает модели быстрее и эффективнее.

Как это работает:

Модели учатся следовать логическим паттернам.
Они переносят процесс рассуждения из выходных данных во скрытые слои.
Модель решает сложные задачи, используя меньше текста.

Обучение модели интернализации этих этапов требует специфических данных и методов. Это помогает модели сохранять точность, снижая при этом стоимость генерации.

За этой областью стоит внимательно следить. Эффективные рассуждения — это следующий шаг для больших языковых моделей.

Источник: https://dev.to/paperium/from-explicit-cot-to-implicit-cot-learning-to-internalize-cot-step-by-step-b59

Опциональное обучающее сообщество: https://t.me/GyaanSetuAi

𝗙𝗿𝗼𝗺 𝗘𝘅𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧 𝘁𝗼 𝗜𝗺𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

Не позволяйте ИИ думать за вас

ИИ — это не только промты

Задержка — самая честная часть ИИ

ИИ работает только в том случае, если вы прошли через трудности