Covid-19 ట్వీట్ల యొక్క అన్వేషణాత్మక విశ్లేషణ
డేటా కథలను చెబుతుంది. ప్రజల సంభాషణలలోని నమూనాలను కనుగొనడానికి నేను Covid-19 ట్వీట్లను విశ్లేషించాను.
డేటాను అర్థం చేసుకోవడానికి నేను మూడు నిర్దిష్ట పద్ధతులను ఉపయోగించాను:
- Topic Modeling: ఇది ట్వీట్లను ప్రధాన అంశాలుగా వర్గీకరిస్తుంది.
- UMAP: ఇది అధిక-డైమెన్షనల్ డేటాను ఒక సరళమైన మ్యాప్గా విజువలైజ్ చేస్తుంది.
- DiGraphs: వివిధ అంశాలు ఒకదానితో ఒకటి ఎలా అనుసంధానించబడి ఉన్నాయో ఇది చూపుతుంది.
కాలక్రమేణా ప్రజలు మహమ్మారి గురించి ఎలా మాట్లాడారో చూడటానికి ఈ ప్రక్రియ మీకు సహాయపడుతుంది. ఇది మిలియన్ల కొద్దీ పదాలను స్పష్టమైన విజువల్ మ్యాప్లుగా మారుస్తుంది.
సోషల్ మీడియాలోని ముడి వచనాన్ని క్రమబద్ధీకరించబడిన జ్ఞానంగా ఎలా మార్చాలో మీరు నేర్చుకుంటారు.
ఐచ్ఛిక అభ్యాస సమూహం: https://t.me/GyaanSetuAi