டீப் நியூரல் நெட்வொர்க்குகளில் தரவு இயல்லாக்கத்தின் (Data Normalization) தாக்கம்

தரவு இயல்லாக்கம் (Data normalization) டீப் நியூரல் நெட்வொர்க்குகள் எவ்வாறு கற்கின்றன என்பதை மாற்றுகிறது.

நீங்கள் காலத் தொடர் கணிப்புடன் (time series forecasting) பணிபுரியும் போது, உங்கள் தரவின் அளவுகள் (scales) மாறுபடும். ஒரு மாறி (variable) 0 முதல் 1 வரை இருக்கலாம். மற்றொன்று 100 முதல் 1000 வரை இருக்கலாம். இந்த அளவிலான வேறுபாடு உங்கள் மாதிரியில் (model) சிக்கல்களை உருவாக்குகிறது.

இயல்லாக்கம் இதைச் சரிசெய்கிறது. இது அனைத்துத் தரவுப் புள்ளிகளையும் ஒரே மாதிரியான அளவிற்கு கொண்டு வருகிறது.

உங்களுக்கு ஏன் இயல்லாக்கம் தேவைப்படுகிறது:

  • இது பயிற்சியை (training) வேகப்படுத்துகிறது.
  • இது மாதிரி விரைவாகத் தரவுப் வடிவங்களைக் (patterns) கண்டறிய உதவுகிறது.
  • பெரிய எண்கள் சிறிய எண்களை ஆதிக்கம் செலுத்துவதைத் தடுக்கிறது.
  • இது உங்கள் கணிப்புத் துல்லியத்தை (prediction accuracy) மேம்படுத்துகிறது.

சரியான முறையைத் தேர்ந்தெடுப்பது முக்கியமானது. நீங்கள் Min-Max scaling அல்லது Z-score standardization ஆகியவற்றில் ஒன்றைத் தேர்ந்தெடுக்க வேண்டும். உங்கள் தரவுப் பரவலைப் (data distribution) பொறுத்து ஒவ்வொரு முறையும் உங்கள் மாதிரியைப் வெவ்வேறு விதமாகப் பாதிக்கும்.

நீங்கள் இயல்லாக்கத்தைப் புறக்கணித்தால், உங்கள் நியூரல் நெட்வொர்க் குவிவதற்கு (converge) சிரமப்படும். உங்கள் பிழை விகிதங்கள் (error rates) அதிகமாகவே இருக்கும். உங்கள் கணிப்புகள் நம்பகத்தன்மையற்றதாக மாறும்.

உங்கள் மாதிரியைப் பயிற்றுவிப்பதற்கு முன் உங்கள் தரவை அளவாக்கம் (scale) செய்யுங்கள்.

ஆதாரம்: https://dev.to/paperium/impact-of-data-normalization-on-deep-neural-network-for-time-series-forecasting-240d

விருப்பத்தேர்வு கற்றல் சமூகம்: https://t.me/GyaanSetuAi