Modelagem conceitual baseada em ontologias aplicada a aprendizado de máquina : uma abordagem em um domínio complexo de transtornos mentais comuns

Anjos, Rafael Afonso dos (2023)

tcc

Em 2008, foi realizada uma pesquisa intitulada "São Paulo Megacity", cujo objetivo era mapear a incidência de transtornos mentais comuns na grande metrópole brasileira. Essa pesquisa forneceu um grande contingente de informações valiosas. Porém, sua estrutura rígida dificulta seu manuseio e impossibilita seu reaproveitamento em trabalhos futuros. Além disso, como as questões abordadas na pesquisa podem sofrer mudanças ao longo do tempo, torna-se difícil realizar uma comparação direta entre seus resultados e os de outras pesquisas. Para solucionar esses problemas, propomos a integração semântica dos resultados da pesquisa utilizando ontologias, o que possibilita uma representação mais flexível e acessível das informações e facilita a comparação entre diferentes pesquisas. Segundo o pesquisador Guarino a ontologia é uma especificação formal explícita de uma conceitualização compartilhada, ou seja, a ontologia nada mais é do que uma disciplina que se preocupa em entender os acontecimentos em sua forma total, e representá-los de forma que diante de qualquer situação a interpretação sobre a representação seja unificada. Neste trabalho, investigamos como utilizar a ontologia para realizar a modelagem conceitual sobre os resultados da pesquisa anteriormente citada. Sendo que a integração semântica no campo da modelagem conceitual é um alto nível de abstração, independente de aspectos de implementação, tornando assim possível a comparação entre duas pesquisas diferentes. Utilizando uma base de dados médicos relacionada a transtornos mentais comuns, realizou- se um levantamento das variáveis disponíveis para definir o escopo da pesquisa. Optou-se por focar nas variáveis relacionadas à depressão e, a partir disso, foram criados modelos conceituais baseados em ontologia e foram mapeadas quais entidades do modelo seriam impactadas por essas variáveis. Em seguida, procedeu-se a transformação dos modelos conceituais em uma base de dados relacional, com mapeamento e população da mesma. Por fim, aplicou-se um algoritmo de classificação Random Forest na base de dados relacional obtida, alcançando um resultado acima de 96% para as métricas de acurácia, precisão e recall, além de uma curva ROC de 99%. Apesar de algumas possibilidades de melhoria na criação dos modelos conceituais, a integração de ontologia se mostrou eficaz na área de depressão. Sendo assim, recomenda-se o uso dessa metodologia em domínios complexos que contenham muitas variáveis.


Collections: