Mapas de Kohonen: estudo aplicado no aprendizado não supervisionado de dígitos manuscritos
tcc
RESUMO: O mapa auto organizável, também chamado de mapa de Kohonen, é construído usando uma rede 2-D de nós predefinidos, utiliza aprendizado competitivo não supervisionado para produzir representações de baixa dimensão para dados de entrada de alta dimensão, ainda preservando relações de similaridade entre os itens apresentados. Este trabalho propõe treinar redes neurais de mapas auto-organizáveis para identificar dígitos manuscritos utilizando o banco de dados MNIST como padrões de entrada. Após treinada a rede, é realizado um processo de rotulagem na rede, e para tal é utilizado 1% dos rótulos dos dados de treinamento. O objetivo desse trabalho é comparar a performance das redes de Kohonen de diferentes tamanhos, e avaliar como o tamanho impacta os resultados. Ao final, para identificação de dígitos manuscritos foi encontrada que a rede de Kohonen de dimensão 16x16, 256 neurônios, apresentou o melhor resultado, atingindo uma acurácia de 90,03%. Esse estudo foi feito utilizando o banco de dados MNIST, e em estudos futuros o objetivo é retirar o maior proveito possível do aprendizado não supervisionado e testá-lo em banco de dados onde existem uma quantidade limitada de rótulos.
ABSTRACT: The self-organized map, sometimes also called a Kohonen map, is built using a 2-D network of predefined nodes and uses unsupervised competitive learning to produce low-dimensional representations for high-dimensional input data, while still preserving similarity between the input data. This work proposes to train neural networks of self-organized maps to identify handwritten digits using the MNIST database as input patterns. After training the network, a labeling process is carried out in the network, and for this it is only used 1% of the labels of the training data. The objective of this work is to compare the performance of Kohonen networks of different sizes, and to evaluate how the size impacts the metrics. In the end, for the identification of handwritten digits, it was found that the self-organized map of 16x16, with 256 nodes, presented the best metrics, reaching an accuracy of 90.03%. This study used the MNIST database as input, and in future studies the objective is to take full advantage of unsupervised learning and test it in a database where there are a limited number of labels.
- Engenharias643
Redes Sociais