Uso do aprendizado de máquinas e explicalidade na investigação da evasão escolar

Cunha, Pedro Luiz Regattieri da (2024-11-28)

dissertacao_mestrado

RESUMO: A evasão escolar é um fenômeno complexo amplamente debatido em diversas áreas do conhecimento, cujas causas são multifatoriais. O avanço da tecnologia tem possibilitado análises mais ágeis e precisas dos fatores que levam os alunos ao abandono escolar. Diante desse contexto, o propósito deste trabalho é investigar modelos preditivos para antecipar a possibilidade de evasão escolar, além de identificar as principais características que influenciam esse fenômeno. Para este fim, utilizou-se um banco de dados específico, contendo informações tanto sobre o desempenho acadêmico dos alunos quanto sobre seus dados socioeconômicos. Técnicas de seleção de características e pré-processamento de dados foram aplicadas para otimizar a qualidade das informações. Com base nisso, foram testados diversos modelos que empregam técnicas de inteligência artificial (IA) para prever a evasão escolar. Os resultados das previsões geradas pelos modelos foram apresentados, acompanhados de suas respectivas métricas de desempenho. O modelo de melhor desempenho apresentou uma acurácia superior a 88%, comparável a trabalhos semelhantes na literatura. Decisões baseadas em IA podem ter impactos significativos, especialmente na vida escolar, o que torna crucial a compreensão dos fatores que influenciam essas previsões. Outro ponto relevante abordado neste trabalho é a explicabilidade dos modelos de IA, fundamental para garantir maior transparência no processo. A explicabilidade foi avaliada por meio de duas técnicas: Informações Mútuas e SHAP (SHapley Additive exPlanations), as quais forneceram resultados semelhantes, com algumas diferenças. A técnica de Informações Mútuas destacou-se pelo menor tempo de execução. Em contrapartida, o SHAP proporcionou uma visão mais abrangente, com informações detalhadas para discussão e análise.

ABSTRACT: School dropout is a complex phenomenon widely debated in various fields of knowledge, with multifactorial causes. Advances in technology have enabled faster and more accurate analyses of the factors leading students to leave school. In this context, the purpose of this work is to investigate predictive models to anticipate the possibility of school dropout and identify the main characteristics influencing this phenomenon. For this purpose, a specific database was used, containing information both on students' academic performance and their socioeconomic data. Feature selection and data preprocessing techniques were applied to optimize the quality of the information. Based on this, several models employing artificial intelligence (AI) techniques were tested to predict school dropout. The results of the predictions generated by the models were presented along with their respective performance metrics. The best-performing model achieved an accuracy above 88%, comparable to similar studies in the literature. AI-based decisions can have significant impacts, especially in the educational domain, making it crucial to understand the factors influencing these predictions. Another relevant point addressed in this work is the explainability of AI models, which is essential to ensure greater transparency in the process. Explainability was evaluated using two techniques: Mutual Information and SHAP (SHapley Additive Explanations), which provided similar results with some differences. The Mutual Information technique stood out for its shorter execution time. In contrast, SHAP offered a more comprehensive view, with detailed information for discussion and analysis.


Collections: