Elaboração de um sistema de recomendação híbrido baseado em combinação sequencial
tcc
RESUMO: Durante a era da internet, a quantidade de dados gerada a todo momento é maior do que se pode consumir, causando um excesso de informação para o usuário. Isso pode ser resolvido se for feita uma mineração destes dados para se obter o mais relevante ao usuário e essa avaliação é feita por um sistema de recomendação. Os sistemas de recomendação são feitos para recomendar algo a usuários e podem ser feitos de diversas formas. Este trabalho pretende descrever como estes sistemas funcionam, além de detalhar a filtragem híbrida com o método de combinação sequencial. Também possui por objetivo desenvolver um sistema de recomendação híbrido por combinação sequencial, disponibilizado via um web service. Após o desenvolvimento, este algoritmo foi testado utilizando um estudo de caso cultural com músicas, onde usuários as avaliavam dando notas de 1 a 5. Depois de uma análise estatística, o sistema de recomendação híbrido por combinação sequencial obteve bons resultados pelo teste do erro quadrático médio, comparada as outras formas de filtragem, tendo um erro de apenas 1,4 ponto em uma amostragem, e 1,27 em outra.
ABSTRACT: During the internet era, the amount of data generated at any given time is greater than what can be consumed, causing an excess of information for the user. This can be solved by mining these data to obtain the most relevant to the user and this evaluation is done by a recommendation system. Recommender systems are designed to recommend something to users and can be done in different ways. This paper intends to describe how these systems work, in addition to detailing the cascade hybrid filtering. It also aims to develop a system of hybrid cascade filtering, made available via a web service. After development, this algorithm was tested using a cultural case study with songs, where users rated them from 1 to 5. After a statistical analysis, the cascade hybrid recommender obtained good results by the root mean square error test, compared to other forms of filtering, having an error of only 1.4 points in one sample, and 1.27 in another.
Redes Sociais