Classificação de gênero de crianças via movimentos dos olhos estimulados por leitura

Coelho, Lucia Almeida (2022)

tcc

RESUMO: A classificação automática de gênero tem muitas aplicações, incluindo a interface de usuário inteligente, vigilância visual e coleta de estatísticas demográficas para marketing, entre outras. Este trabalho faz a classificação de gênero por meio do rastreamento do movimento ocular estimulado pela leitura para diferenciar os gêneros nas crianças. Foi utilizada a base de dados pública de Benfatto et al. (2016) que coletou movimentos dos olhos de crianças durante a leitura de um texto. Essas crianças possuiam entre 8 e 9 anos de idade. Os movimentos oculares foram registrados em 100 Hz. Os ângulos dos olhos são a entrada nos experimentos. A identificação é feita por diferentes algoritmos de aprendizado de máquina supervisionados aplicados ao problema de classificação de gênero. Para o processo de extração de características é utilizada a técnica de wavelets com as famílias: Biortogonal com quatro níveis e Symlets com seis níveis. Foram nove os classificadores escolhidos, sendo eles: KNN (k-nearest neighbors), SVM (Support Vector Machine), com kernel e função de base linear e radial, Processo Gaussiano, Árvore de Decisão, Floresta Aleatória, AdaBoost, Naïve-Bayes e Análise Discriminante Quadrática. A combinação da família Biorthogonal com um classificador de árvore de decisão tem o melhor resultado com uma precisão de 81,08% e uma medida F1 de 0,63%.

ABSTRACT: Automatic gender classification has many applications, including smart user interface, visual surveillance, and gathering demographic statistics for marketing, among others. This work makes the classification of gender through the tracking of eye movement stimulated by reading to differentiate the genders in children. The public database of Benfatto et al. (2016) was used, which collected eye movements of children while reading a text. These children were between 8 and 9 years old. Eye movements were recorded at 100 Hz. Eye angles are the input to experiments. The identification is done by different supervised machine learning algorithms applied to the gender classification problem. For the feature extraction process, the wavelet technique is used with the families: Biorthogonal with four levels and Symlets with six levels. Nine classifiers were chosen, namely: KNN (k-nearest neighbors), SVM (Support Vector Machine), with kernel and linear and radial basis function, Gaussian Process, Decision Tree, Random Forest, AdaBoost, Naïve-Bayes and Quadratic Discriminant Analysis. Combining the Biorthogonal family with a decision tree classifier has the best result with an accuracy of 81.08% and an F1 measure of 0.63%.


Colecciones: