Implementação de um algoritmo de equidade para sistemas de recomendação
tcc
RESUMO: Os algoritmos dos Sistemas de Recomendação utilizam dados históricos para realizar recomendações para os usuários, porém podem apresentar resultados tendenciosos para determinados grupos devido a desequilíbrios na entrada de dados do sistema, gerando em alguns casos comportamentos antiéticos como o racismo, sendo de suma importância encontrar meios de resolver essa problemática. Esse trabalho realiza a análise e a implementação de um algoritmo de equidade aplicado a um webservice utilizando métricas de justiça para avaliar e promover a equidade entre os grupos de usuário. O conjunto de dados utilizado para teste foi uma base de dados referente a avaliações de 10 músicas diferentes e para avaliação, foram selecionados 59 avaliadores atribuindo notas em uma escala de 0 a 5. A validação do algoritmo foi feita utilizando duas estratégias de agrupamento, sendo elas o agrupamento 50-50, que divide os usuários em dois grupos iguais, e o agrupamento 95-5, que divide os 5% dos usuários que mais avaliaram em um grupo e os 95% restantes que menos avaliaram em outro grupo. O teste foi aplicado as estratégias de recomendação do tipo Filtragem Colaborativa, Filtragem Baseada em Conteúdo e no algoritmo Híbrida Cascata. Em todos os agrupamentos e algoritmos foi possível diminuir a injustiça do grupo e aumentar a eficiência da recomendação. E o melhor resultado na diminuição da injustiça do grupo foi encontrado no agrupamento 50-50 utilizando o algoritmo de Filtragem Baseada em Conteúdo, que foi possível obter uma redução de 99,96% na injustiça do grupo, além de um ganho de eficiência de 56,96%.
ABSTRACT: Recommendation Systems algorithms use historical data to make recommendations for users, however they may present biased results for certain groups due to imbalances in the system’s data input, generating in some cases unethical behavior such as racism, being of It is extremely important to find ways to resolve this problem. This work analyzes and implements an equity algorithm applied to a webservice using fairness metrics to evaluate and promote equity between user groups. The data set used for testing was a database referring to evaluations of 10 different songs and for evaluation, 59 evaluators were selected, assigning grades on a scale from 0 to 5. Validation of the algorithm was carried out using two grouping strategies, being they are the 50-50 grouping, which divides users into two equal groups, and the 95-5 grouping, which divides the 5% of users who rated the most in one group and the remaining 95% who rated the least in another group. The test was applied to recommendation strategies such as Collaborative Filtering, Content-Based Filtering and the Hybrid Cascade algorithm. In all groupings and algorithms it was possible to reduce group unfairness and increase recommendation efficiency. And the best result in reducing group unfairness was found in the 50-50 grouping using the Content-Based Filtering algorithm, which made it possible to obtain a 99.96% reduction in group unfairness, in addition to an efficiency gain of 56.96%.
Redes Sociais