Uso de ontologias e machine learning para auxiliar em processos de prevenção da evasão escolar

Silva, Eduardo Moura da (2022)

dissertacao_mestrado

A Evasão escolar é um relevante problema social que ocorre em grande escala e traz grandes impactos para todos, principalmente para os alunos. Esse cenário se agravou com a pandemia da COVID-19. De acordo com G1 (2021), baseado em dados da Pesquisa Nacional por Amostra de Domicílios Contínua (PNAD Contínua), cerca de 244 mil crianças e adolescentes entre 6 e 14 anos estavam fora da escola no segundo trimestre de 2021. O número representa um aumento de 171% em comparação a 2019, quando 90 mil crianças estavam fora da escola. Os dados acerca da evasão estão em diferentes bases de dados, que possuem modelagens e schemas diferentes. Portanto, esta pesquisa têm como principais requisitos: construir formas de padronizar os dados do domínio, apoiar a descoberta de fatores que contribuem para a evasão escolar e como estão associados a dados (acadêmicos e socioeconômicos) dos alunos, e prover uma forma de criar modelos de ML para diferentes fontes de dados que sejam aplicáveis a diferentes contextos e instituições educacionais para realizar a predição da evasão escolar. Com estes objetivos, propor soluções técnicas que possam auxiliar gestores escolares a direcionarem as estratégias pedagógicas para alunos que possuem maiores riscos de evadirem. A abordagem proposta neste trabalho possibilita a aplicação de análises de dados de evasão escolar de forma mais ampla. Com os repositórios padronizados segundo a ontologia, é possível realizar análises baseadas em um maior volume de dados, o que favorece as identificações de padrões de evasão, bem como a realização de análises estatísticas. Com os avanços na área de Inteligência Artificial, estudos e aplicações combinando Machine Learning (ML) e ontologias estão cada vez mais presentes. Nessa interseção, as ontologias possibilitam uma melhor compreensão do domínio e dos dados, o que é essencial para fornecer integração semântica de diferentes fontes de dados e para favorecer uma aplicação adequada das técnicas de ML. Este trabalho demonstra como essa combinação favorece o desenvolvimento de recursos tecnológicos para predição da evasão escolar que podem ser aplicados a diferentes instituições de ensino.

School dropout is a relevant social problem that occurs on a large scale and has great impacts on everyone, especially students. This scenario has worsened with the COVID-19 pandemic. According to G1 (2021), based on data from the Continuous National Household Sample Survey (Continuous PNAD), about 244,000 children and adolescents between 6 and 14 years old were out of school in the second quarter of 2021. The number represents an increase of 171% compared to 2019, when 90,000 children were out of school. Data about dropout are in different databases, which have different models and schemas. Therefore, this research has as main requirements: to build ways to standardize domain data, discover factors that contribute to school dropout and how they are associated with data (academic and socioeconomic) of students, and provide a way to create ML models for different data sources that are applicable to different contexts and educational institutions to carry out the prediction of school dropout. With these objectives, to propose technical solutions that can help school managers to direct pedagogical strategies to students who are at greater risk of dropping out. The approach proposed in this work enables the application of analysis of school dropout data in a broader way. With repositories standardized according to the ontology, it is possible to carry out analyzes based on a greater volume of data, which favors the identification of evasion patterns, as well as performing statistical analyses. With advances in Artificial Intelligence, studies and applications combining Machine Learning (ML) and ontologies are increasingly present. At this intersection, ontologies enable a better understanding of the domain and the data, which is essential to provide semantic integration of different data sources and favor a proper application of ML techniques. This work demonstrates how this combination favors the development of technological resources for the prediction of school dropout, which can be applied to different educational institutions


Collections: