Sistema de apoio à detecção de fraudes em E-Commerce
Dissertação de mestrado
RESUMO: O comércio eletrônico torna-se cada vez mais popular à medida que a sociedade se move em direção a uma economia digital. Contudo, essa popularidade tem sido acompanhada por um aumento de práticas fraudulentas. Para evitar fraudes, as empresas de e-commerce investem uma quantidade significativa de dinheiro e tempo em soluções de terceiros que visam reduzir perdas. Comumente, por serem serviços de pagamento, essas soluções têm acesso apenas a um subconjunto reduzido de informações e tentam identificar transações fraudulentas analisando, por exemplo, o perfil do cliente e os dados de pagamento dos pedidos. Neste processo de análise convencional, as informações específicas de e-commerce, como o comportamento de navegação do cliente, seus dados cadastrais, seu histórico de compras, dentre outras são ignoradas. O objetivo deste trabalho é, portanto, propor um sistema de detecção de fraudes que utiliza tanto informações de pagamento, quanto informações de domínio do e-commerce para classificar transações como legítimas ou fraudulentas. Nesse trabalho, destacamos duas contribuições: em primeiro lugar, mostra a importância do conhecimento do domínio na identificação de fraudes; em segundo lugar, o sistema proposto apresentado neste trabalho pretende facilitar o projeto sistemático de novos sistemas anti-fraude. No trabalho de detecção de fraudes, foram utilizados dados reais de um e-commerce de bebidas, modelados em três classificadores: baseado em regras (algoritmo RIPPER), árvore de decisão (algoritmo C4.5) e naive bayes. Adicionalmente, os resultados dos classificadores são comparados e o sistema de detecção de fraudes é proposto, apresentando desempenho excelente em relação à área sob a curva ROC.
ABSTRACT: Electronic commerce (e-commerce) has become more popular as society moves deeper towards a digital economy. Although, this popularity has been accompanied by an increase in fraudulent practices. In order to prevent frauds, e-commerce merchants invest significant amount of money and time in 3rd party solutions that aim to reduce losses. Commonly, as payment services, these solutions have access only to a reduced subset of information and try to identify fraudulent transactions by analyzing, for example, customer profile and payment method data. In this conventional analysis process, e-commerce specific information, such as customer search and browser behavior, promotion usage, etc. are ignored. The objective of this work is, therefore, to propose a fraud detection system at the e-commerce side that uses both payment information and e-commerce domain information to classify transactions as legitimate or fraudulent. The contributions of this research are twofold. Firstly, it shows the importance of domain knowledge at identifying frauds. Secondly, the proposed system intends to facilitate the systematic design of new anti-fraud systems. In order to detect fraudulent transactions, real data was used from e-commerce beverage store, modeled on three classifiers: rule-based (RIPPER algorithm), decision tree (C4.5 algorithm) and naive bayes. In addition, the results of the classifiers are compared and the fraud detection system is proposed, presenting excellent performance in relation to the area under the ROC curve.
- Engenharias234
Redes Sociais