Análise de sentimentos em Tweets sobre a Pandemia COVID-19 usando Redes Neurais Long Short-Term Memory
tcc
Neste trabalho de conclusão de curso, investigamos o desempenho da rede neural artificial Long Short-Term Memory (LSTM) na tarefa de análise de sentimentos em tweets acerca da pandemia COVID-19. Para isso, organizamos as nossas próprias bases de dados a partir de subconjuntos de um amplo conjunto de tweets em língua inglesa. Investigamos a performance do modelo a partir de uma complexificação das bases de dados e de variações de tamanhos nas partições de treinamento, validação e teste. Aplicamos a remoção de stopwords nos tweets e realizamos sua vetorização utilizando uma rede neural Word2Vec pré-treinada com um corpus de tweets referentes à COVID-19. Os resultados obtidos apresentaram acurácia superior a 88% em todos os cenários investigados.
In this undergraduate thesis, we investigate the performance of the artificial neural network Long Short-Term Memory (LSTM) in the task of sentiment analysis in tweets about the COVID-19 pandemic. For this purpose, we organize our datasets from subsets of a broad set of tweets in English language. We investigated the performance of the model based on a complexification of datasets and variations in sizes of training, validation, and testing partitions. We applied stopwords removal in the tweets and performed its vectorization using a pre-trained Word2Vec shallow neural network with a corpus of tweets referring to COVID-19 pandemic. The results obtained showed accuracy greater than 88% in all investigated scenarios.
Redes Sociais