Covid-19 ಟ್ವೀಟ್ಗಳ ಅನ್ವೇಷಣಾತ್ಮಕ ವಿಶ್ಲೇಷಣೆ
ದತ್ತಾಂಶವು ಕಥೆಗಳನ್ನು ಹೇಳುತ್ತದೆ. ಸಾರ್ವಜನಿಕ ಸಂಭಾಷಣೆಯಲ್ಲಿನ ಮಾದರಿಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ನಾನು Covid-19 ಟ್ವೀಟ್ಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಿದೆ.
ದತ್ತಾಂಶವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ನಾನು ಮೂರು ನಿರ್ದಿಷ್ಟ ವಿಧಾನಗಳನ್ನು ಬಳಸಿದೆ:
- Topic Modeling: ಇದು ಟ್ವೀಟ್ಗಳನ್ನು ಮುಖ್ಯ ವಿಷಯಗಳಾಗಿ ಗುಂಪು ಮಾಡುತ್ತದೆ.
- UMAP: ಇದು ಹೆಚ್ಚಿನ ಆಯಾಮದ ದತ್ತಾಂಶವನ್ನು (high-dimensional data) ಸರಳ ನಕ್ಷೆಯಲ್ಲಿ ದೃಶ್ಯೀಕರಿಸುತ್ತದೆ.
- DiGraphs: ಇದು ವಿವಿಧ ವಿಷಯಗಳು ಹೇಗೆ ಪರಸ್ಪರ ಸಂಬಂಧ ಹೊಂದಿವೆ ಎಂಬುದನ್ನು ತೋರಿಸುತ್ತದೆ.
ಈ ಪ್ರಕ್ರಿಯೆಯು ಜನರು ಕಾಲಾನಂತರದಲ್ಲಿ ಸಾಂಕ್ರಾಮಿಕ ರೋಗದ ಬಗ್ಗೆ ಹೇಗೆ ಮಾತನಾಡಿದರು ಎಂಬುದನ್ನು ನೋಡಲು ನಿಮಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಇದು ಲಕ್ಷಾಂತರ ಪದಗಳನ್ನು ಸ್ಪಷ್ಟವಾದ ದೃಶ್ಯ ನಕ್ಷೆಗಳನ್ನಾಗಿ ಪರಿವರ್ತಿಸುತ್ತದೆ.
ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮದ ಕಚ್ಚಾ ಪಠ್ಯವನ್ನು ಹೇಗೆ ರಚನಾತ್ಮಕ ಜ್ಞಾನವಾಗಿ ಪರಿವರ್ತಿಸಬೇಕೆಂದು ನೀವು ಕಲಿಯುತ್ತೀರಿ.
ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi