Coronadata : Integração Semântica de Bases de Dados de Covid-19 no Brasil

Flegler, Lucas Gomes (2022)

tcc

RESUMO: Diante de um dos maiores desafios sanitários deste século, a COVID-19 sido um desafio global aos sistemas de saúde, expandindo em velocidade crescente de óbitos. Já se contabilizava aproximadamente 71.886 casos oficiais de infecção pela COVID-19 e 5.017 mortes no Brasil em 28 de abril de 2020 e, ao findar o ano de 2021, foram registrados um total aproximado de 285 milhões de casos e 5,4 milhões de óbitos em todo o mundo. Mediante ao cenário atual, no Brasil, foi declarada Emergência em Saúde Pública de importância Nacional (ESPIN) em fevereiro de 2020. A atualização destes dados no Brasil é feita de forma diária pelo Ministério da Saúde através das informações oficiais repassadas pelas Secretarias Estaduais de Saúde das 27 Unidades Federativas brasileiras. Entretanto, dados disponibilizados por esse painel é feito agrupadamente ao nível de município e não permite fazer consultas mais detalhadas de cada paciente. Neste trabalho, foi desenvolvido um ferramental capaz de extrair os dados de quatro secretarias de saúde, integrar as quatro bases de dados em uma única base e disponibilizar os dados separados por pacientes que vieram a óbito por COVID-19. Através do uso de ontologia de fundamentação (UFO), foram construídos dois bancos de dados, de modo a permitir o desenvolvimento de bases de dados que possibilitem utilização eficiente tanto para o uso como repositórios de dados transacionais (OLTP), quanto analítico (OLAP). Também são apresentadas técnicas de pré-processamento como, limpeza, integração de dados, redução, transformação e discretização. Por fim, é apresentado o resultado da integração através da disponibilização dos dados por meio de APIs e elaboração de gráficos.

ABSTRACT: Faced with one of the greatest health challenges of this century, COVID-19 has been a global challenge for health systems, expanding at an increasing rate of deaths. There were already approximately 71,886 official cases of COVID-19 infection and 5,017 deaths in Brazil on April 28, 2020 and, by the end of 2021, a total of approximately 285 million cases and 5.4 million deaths had been recorded all around the world. Given the current scenario, in Brazil, a Public Health Emergency of National Importance (ESPIN) was declared in February 2020. The Ministry of Health updates these data on a daily basis through official information provided by the State Health Secretariats of the 27 Brazilian Federative Units. However, data made available by this panel is grouped at the municipal level and does not allow for more detailed queries for each patient. In this work, a tool capable of extracting data from four health departments was developed, integrating the four databases into a single database and making data available separated by patients who died from COVID-19. Through the use of foundational ontology (UFO), two databases were built, in order to allow the development of databases that allow efficient use both for use as transactional (OLTP) and analytical (OLAP) data repositories . Pre-processing techniques such as cleaning, data integration, reduction, transformation and discretization are also presented. Finally, the result of the integration is presented by making the data available through APIs and graphing.


Collections: