Covid-19 ட்வீட்களின் ஆய்வுப் பகுப்பாய்வு
தரவுகள் கதைகளைச் சொல்கின்றன. பொது உரையாடல்களில் உள்ள வடிவங்களைக் கண்டறிய நான் Covid-19 ட்வீட்களைப் பகுப்பாய்வு செய்தேன்.
தரவைப் புரிந்துகொள்ள நான் மூன்று குறிப்பிட்ட முறைகளைப் பயன்படுத்தினேன்:
- Topic Modeling: இது ட்வீட்களை முக்கியத் தலைப்புகளாகப் பிரிக்கிறது.
- UMAP: இது உயர்-பரிமாணத் தரவை (high-dimensional data) ஒரு எளிய வரைபடம் மூலம் காட்சிப்படுத்துகிறது.
- DiGraphs: இது வெவ்வேறு தலைப்புகள் எவ்வாறு ஒன்றோடொன்று இணைக்கப்பட்டுள்ளன என்பதைக் காட்டுகிறது.
காலப்போக்கில் மக்கள் பெருந்தொற்றைப் பற்றி எவ்வாறு பேசினார்கள் என்பதைப் பார்க்க இந்தச் செயல்முறை உதவுகிறது. இது மில்லியன் கணக்கான சொற்களைத் தெளிவான காட்சி வரைபடங்களாக மாற்றுகிறது.
சமூக ஊடகங்களின் மூலத் தரவுகளை எவ்வாறு கட்டமைக்கப்பட்ட அறிவாக மாற்றுவது என்பதை நீங்கள் கற்றுக்கொள்ளலாம்.
விருப்பத்தேர்வு கற்றல் சமூகம்: https://t.me/GyaanSetuAi