Covid-19 推文探索性分析
数据会说话。我通过分析 Covid-19 推文来寻找公众对话中的模式。
我使用了三种特定方法来理解数据:
- 主题建模 (Topic Modeling):将推文按主要主题进行分组。
- UMAP:将高维数据可视化为简单的地图。
- 有向图 (DiGraphs):展示不同主题之间是如何相互关联的。
这个过程可以帮助你观察人们随时间推移讨论疫情的方式。它将数百万个词汇转化为清晰的可视化图谱。
你将学习如何将原始的社交媒体文本转化为结构化知识。
可选学习社区:https://t.me/GyaanSetuAi