Covid-19 ਟਵੀਟਸ ਦਾ ਖੋਜੀ ਵਿਸ਼ਲੇਸ਼ਣ
ਡੇਟਾ ਕਹਾਣੀਆਂ ਸੁਣਾਉਂਦਾ ਹੈ। ਮੈਂ ਜਨਤਕ ਗੱਲਬਾਤ ਵਿੱਚ ਪੈਟਰਨ ਲੱਭਣ ਲਈ Covid-19 ਟਵੀਟਸ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ।
ਮੈਂ ਡੇਟਾ ਨੂੰ ਸਮਝਣ ਲਈ ਤਿੰਨ ਵਿਸ਼ੇਸ਼ ਤਰੀਕਿਆਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ:
- Topic Modeling: ਇਹ ਟਵੀਟਸ ਨੂੰ ਮੁੱਖ ਵਿਸ਼ਿਆਂ ਵਿੱਚ ਵੰਡਦਾ ਹੈ।
- UMAP: ਇਹ ਉੱਚ-ਆਯਾਮੀ (high-dimensional) ਡੇਟਾ ਨੂੰ ਇੱਕ ਸਰਲ ਨਕਸ਼ੇ ਵਿੱਚ ਦਰਸਾਉਂਦਾ ਹੈ।
- DiGraphs: ਇਹ ਦਿਖਾਉਂਦਾ ਹੈ ਕਿ ਵੱਖ-ਵੱਖ ਵਿਸ਼ੇ ਇੱਕ ਦੂਜੇ ਨਾਲ ਕਿਵੇਂ ਜੁੜੇ ਹੋਏ ਹਨ।
ਇਹ ਪ੍ਰਕਿਰਿਆ ਤੁਹਾਨੂੰ ਇਹ ਦੇਖਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ ਕਿ ਲੋਕ ਸਮੇਂ ਦੇ ਨਾਲ ਮਹਾਂਮਾਰੀ ਬਾਰੇ ਕਿਵੇਂ ਗੱਲ ਕਰਦੇ ਰਹੇ। ਇਹ ਲੱਖਾਂ ਸ਼ਬਦਾਂ ਨੂੰ ਸਪਸ਼ਟ ਵਿਜ਼ੂਅਲ ਨਕਸ਼ਿਆਂ ਵਿੱਚ ਬਦਲ ਦਿੰਦੀ ਹੈ।
ਤੁਸੀਂ ਸਿੱਖਦੇ ਹੋ ਕਿ ਕਿਵੇਂ ਕੱਚੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਟੈਕਸਟ ਨੂੰ ਸੰਗਠਿਤ ਗਿਆਨ ਵਿੱਚ ਬਦਲਿਆ ਜਾ ਸਕਦਾ ਹੈ।
ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi