Ferramenta de análise de sentimentos de tweets

Vaillant, Eduardo Brito (2022)

tcc

RESUMO: As redes sociais são ambientes muito populares no cotidiano de milhões de pessoas pelo mundo. Dentre as diversas redes sociais existentes, uma das mais populares é o Twitter, que é uma plataforma que permite que seus usuários produzam diariamente uma quantidade considerável de tweets, contendo suas opiniões sobre os mais variados assuntos. A análise de sentimentos se baseia em determinar o sentimento expresso em textos atráves do processamento de linguagem natural. Esse tipo de análise tem se tornado um importante campo de estudos nesse ambiente de redes sociais, devido ao vasto volume de dados produzidos, possibilitando o desenvolvimento de diversas aplicações. Este trabalho tem como objetivo desenvolver uma ferramenta que colete tweets sobre o modelo de ensino a distância durante o período da pandemia do COVID- 19, criando uma base de tweets para ser analisada visando, posteriormente, determinar os sentimentos expressos pelos usuários do Twitter sobre o tema em questão. Com o coletor desenvolvido, foram obtidos 84025 tweets em um período de 31 dias. O modelo utilizado para a classificação foi o Naive Bayes Multinomial, que após o treinamento obteve uma acurácia de 76%, classificando 55,36% do tweets coletados como positivos, 37,17% como negativos e 7,47% como neutros.

ABSTRACT: Social networks are very popular environments in the daily lives of millions of people around the world. Among the various existing social networks, one of the most popular is Twitter, which is a platform that allows its users to produce a considerable amount of tweets daily, containing their opinions on the most varied subjects. Sentiment analysis is based on determining the sentiment expressed in texts through natural language processing, this type of analysis has become an important field of study in this social network environment, due to the vast volume of data produced, enabling the development of several applications. This work aims to develop a tool that collects tweets about the distance learning model during the COVID-19 pandemic period, creating a base of tweets to be analyzed later in order to determine the sentiments expressed by Twitter users on the topic in question. With the developed collector, 84025 tweets were collected in a period of 31 days. The model used for classification was the Multinomial Naive Bayes, which after training obtained an accuracy of 76%, classifying 55.36% of the collected tweets as positive, 37.17% as negative and 7.47% as neutral.


Collections: