การเรียนรู้ในมิติสูงคือการทำ Extrapolation เสมอ
ข้อมูลที่มีมิติสูงเปลี่ยนวิธีการที่เครื่องจักรเรียนรู้
โมเดลส่วนใหญ่ทำงานได้ดีกับข้อมูลที่ใช้ฝึกสอน (training data) แต่จะล้มเหลวเมื่อต้องเผชิญกับรูปแบบใหม่ๆ ซึ่งสิ่งนี้เกิดขึ้นเนื่องจากมิติที่สูง
ในมิติที่สูง จุดข้อมูลจะอยู่ห่างกันมาก มีช่องว่างเกิดขึ้นระหว่างจุดข้อมูลของคุณ โมเดลจึงต้องคาดเดาว่าเกิดอะไรขึ้นในช่องว่างเหล่านี้
การคาดเดานี้คือการทำ Extrapolation
เมื่อโมเดลทำ Extrapolation มันจะสร้างสมมติฐานขึ้นมา หากสมมติฐานเหล่านั้นผิด โมเดลก็จะล้มเหลว
ประเด็นสำคัญที่ควรจำ:
- มิติที่สูงสร้างช่องว่างอันกว้างใหญ่
- โมเดลต้องเติมเต็มช่องว่างเหล่านี้เพื่อทำการพยากรณ์
- การพยากรณ์ในช่องว่างเหล่านี้ขึ้นอยู่กับการทำ Extrapolation
- การทำ Extrapolation เพิ่มความเสี่ยงในการเกิดข้อผิดพลาด
การเข้าใจเรื่องนี้จะช่วยให้คุณสร้างโมเดลที่ดีขึ้นได้ คุณต้องรู้ว่าเมื่อใดที่โมเดลของคุณกำลังคาดเดาอยู่
Source: https://dev.to/paperium/learning-in-high-dimension-always-amounts-to-extrapolation-1nk
Optional learning community: https://t.me/GyaanSetuAi