Phân tích khám phá các Tweet về Covid-19
Dữ liệu kể những câu chuyện. Tôi đã phân tích các tweet về Covid-19 để tìm ra các quy luật trong các cuộc thảo luận công khai.
Tôi đã sử dụng ba phương pháp cụ thể để hiểu dữ liệu:
- Topic Modeling: Phương pháp này nhóm các tweet vào các chủ đề chính.
- UMAP: Phương pháp này trực quan hóa dữ liệu đa chiều thành một bản đồ đơn giản.
- DiGraphs: Phương pháp này cho thấy cách các chủ đề khác nhau kết nối với nhau.
Quy trình này giúp bạn thấy được cách mọi người thảo luận về đại dịch theo thời gian. Nó biến hàng triệu từ ngữ thành các bản đồ trực quan rõ ràng.
Bạn sẽ học được cách chuyển đổi văn bản thô từ mạng xã hội thành kiến thức có cấu trúc.
Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi