Detecção de fraudes em pagamentos com cartão de crédito utilizando técnicas de aprendizado de máquina

Lima, Sarah Coura de (2023)

tcc

RESUMO: A crescente dependência das transações eletrônicas, em especial aquelas realizadas com cartões de crédito, tem revolucionado a forma como as sociedades modernas conduzem suas atividades financeiras. No entanto, esse avanço tecnológico também trouxe consigo um aumento significativo no número de fraudes financeiras, representando um desafio crítico para as instituições financeiras e seus clientes. Em resposta a essa ameaça constante, o campo do Aprendizado de Máquina emergiu como uma ferramenta poderosa para a detecção precoce e eficaz de transações fraudulentas. Este trabalho teve como objetivo construir modelos de Aprendizado de Máquina para a detecção de fraudes em transações com cartão de crédito. Foram considerados quatro algoritmos de aprendizado supervisionado: k-Nearest Neighbors, Árvore de Decisão, Random Forest e SVM. O efeito do desequilíbrio entre classes no desempenho dos classificadores foi investigado por meio da aplicação da técnica ADASYN, que realiza o balanceamento das classes pela super-amostragem da classe minoritária. As diferentes estratégias foram comparadas com foco na métrica F1-Score, que é a média harmônica entre precisão e recall. Os resultados dos experimentos apontaram que os classificadores obtiveram maior F1-Score quando treinados com os dados desbalanceados. Todos os modelos de classificação propostos demonstraram desempenho satisfatório, com destaque para o SVM, que alcançou F1-Score de 89,24%, identificando 84,69% das transações fraudulentas com precisão de 94,32%.

ABSTRACT: The ever-growing reliance on electronic transactions, especially those carried out with credit cards, has revolutionized the way modern societies conduct their financial activities. However, this technological advance has also brought with it a significant increase in the number of financial frauds, posing a critical challenge for financial institutions and their customers. In response to this constant threat, the field of Machine Learning has emerged as a powerful tool for the early and effective detection of fraudulent transactions. This work aimed to build Machine Learning models for fraud detection in credit card transactions. Four supervised learning algorithms were considered: k-Nearest Neighbors, Decision Tree, Random Forest and SVM. The effect of class imbalance on classifier performance was investigated by applying the ADASYN technique, which balances classes by oversampling the minority class. The different strategies were compared with a focus on the F1-Score metric, which is the harmonic mean of precision and recall. The results of the experiments showed that the classifiers obtained higher F1-Score when trained with unbalanced data. All the proposed classification models showed satisfactory performance, with SVM standing out, which achieved an F1-Score of 89.24%, identifying 84.69% of fraudulent transactions with a precision of 94.32%.


Collections: