Leren in hoge dimensies komt altijd neer op extrapolatie
Hoogdimensionale data verandert de manier waarop machines leren.
De meeste modellen werken goed op trainingsdata. Ze falen wanneer ze nieuwe patronen tegenkomen. Dit komt door de hoge dimensies.
In hoge dimensies liggen datapunten ver uit elkaar. Er bestaan lege ruimtes tussen je datapunten. Het model moet raden wat er in deze lege ruimtes gebeurt.
Dit raden is extrapolatie.
Wanneer een model extrapoleert, doet het aannames. Als die aannames onjuist zijn, faalt het model.
Belangrijke punten om te onthouden:
- Hoge dimensies creëren enorme lege ruimtes.
- Modellen moeten deze gaten opvullen om voorspellingen te doen.
- Voorspellingen in deze gaten zijn gebaseerd op extrapolatie.
- Extrapolatie vergroot het risico op fouten.
Het begrijpen hiervan helpt je bij het bouwen van betere modellen. Je moet weten wanneer je model aan het raden is.
Bron: https://dev.to/paperium/learning-in-high-dimension-always-amounts-to-extrapolation-1nk
Optionele leercommunity: https://t.me/GyaanSetuAi