Обучение в высокой размерности всегда сводится к экстраполяции
Высокоразмерные данные меняют способ обучения машин.
Большинство моделей хорошо работают на обучающих данных. Они терпят неудачу, когда сталкиваются с новыми паттернами. Это происходит из-за высокой размерности.
В пространствах высокой размерности точки данных расположены далеко друг от друга. Между вашими точками данных существуют пустые пространства. Модель вынуждена угадывать, что происходит в этих пустых пространствах.
Это угадывание и есть экстраполяция.
Когда модель экстраполирует, она делает предположения. Если эти предположения неверны, модель ошибается.
Ключевые моменты, которые стоит запомнить:
- Высокая размерность создает огромные пустые пространства.
- Модели должны заполнять эти пробелы, чтобы делать предсказания.
- Предсказания в этих пробелах опираются на экстраполяцию.
- Экстраполяция повышает риск ошибок.
Понимание этого помогает создавать более качественные модели. Вы должны знать, когда ваша модель просто угадывает.
Источник: https://dev.to/paperium/learning-in-high-dimension-always-amounts-to-extrapolation-1nk
Дополнительное обучающее сообщество: https://t.me/GyaanSetuAi