Estudo de limiar do classificador vizinho mais próximo com características LBP para reconhecimento facial
tcc
Atualmente, o uso da biometria está cada vez mais presente em diversas áreas. Um dos grandes avanços nessa área é o reconhecimento facial, que desempenha um papel fundamental na garantia da segurança em áreas como controle de fronteiras, acesso a locais restritos, como academias, e transações financeiras. Neste trabalho foi desenvolvido um sistema de reconhecimento por meio da abordagem clássica de reconhecimento de padrões, que envolve as etapas de extração de características e classificação. A extração de características foi feita utilizando o método LBP (Local Binary Patterns) nas imagens de rosto detectadas pelo algoritmo Viola-Jones, enquanto a classificação foi feita por meio do algoritmo k-NN (k-Nearest Neighbors), com k=1 e usando a distância qui-quadrado. Esta distância é então comparada com um valor de limiar (threshold). Determinar o limiar da distância é um fator fundamental e determinante para garantir a eficácia e a precisão do sistema. O limiar é responsável por determinar se a imagem a ser reconhecida é identificada como alguma foto de uma pessoa mais parecida ou simplesmente não ser reconhecida pelo sistema. O objetivo desse trabalho foi realizar um estudo para avaliar o melhor limiar de distância em um sistema de reconhecimento facial. Os testes foram feitos em dois conjuntos de dados de faces: o A&T, composto por 400 imagens, e o Yale Face Database, com 165 imagens. Os resultados dos testes foram analisados por meio de métricas derivadas da matriz de confusão, incluindo acurácia, precisão, especificidade, sensibilidade e f-score. Os melhores resultados com relação ao f-score foram apresentados com o limiar 60 nos testes usando o banco de imagens Yale Face Database, com f-score de 0,894 e no AT&T, com f-score de 0,964 quando os parâmetros relacionado ao algoritmo de detecção facial scaleFactor é 1.2 e o minNeighbor é 5. E 70 no AT&T, com f-score de 0,945 quando o scaleFactor é 1.01 e o minNeighbor é 3. Conjectura-se que os melhores resultados, independe da base de dados, estão em limiares próximos, pois estão relacionados ao tamanho das imagens de treinamento e testes. Todas as imagens treinadas e testadas tiveram suas faces destacadas e redimensionadas para 100×150.
Currently, the use of biometrics is increasingly present in several areas. One of the great advances in this area is facial recognition, which plays a key role in ensuring security in areas such as border control, access to restricted places such as gyms, and financial transactions. In this work, a recognition system was developed through the classical approach of pattern recognition, which involves the steps of feature extraction and classification. Feature extraction was performed using the LBP method (Local Binary Patterns) on the face images detected by the Viola-Jones algorithm, while classification was performed using the k-NN algorithm (k-Nearest Neighbors), with k=1 and using the chi-square distance. This distance is then compared to a threshold value. Determining the distance threshold is a fundamental and determining factor to ensure the effectiveness and accuracy of the system. The threshold is responsible for determining whether the image to be recognized is identified as a photo of a more similar person or simply not recognized by the system. The objective of this work was to carry out a study to evaluate the best distance threshold in a facial recognition system. The tests were performed on two face datasets: the A&T, consisting of 400 images, and the Yale Face Database, with 165 images. The tests results were analyzed using metrics derived from the confusion matrix, including accuracy, precision, specificity, sensitivity and f-score. The best results regarding the f-score were presented with the threshold 60 in the tests using the Yale Face Database image bank, with an f-score of 0.894 and in the AT&T, with f- emphscore of 0.964 when the parameters related to the face detection algorithm scaleFactor is 1.2 and minNeighbor is 5. And 70 on AT&T, with f-score of 0.945 when scaleFactor is 1.01 and minNeighbor is 3. It is conjectured that the best results, regardless of the database, are in close thresholds, as they are related to the size of the training and testing images. All trained and tested images had their faces highlighted and resized to 100×150.
Redes Sociais