Uso de modelos de aprendizado de máquina para análise e predição de recuperação de pacientes de covid-19 no município de Vitória-ES

Eisenlohr, Igor Miranda (2022)

trabalho de conclusão de curso

RESUMO: Com a aparição do novo coronavírus, SARS-CoV-2, o mundo passou a estar em condição de pandemia e 6.341.446 óbitos foram registrados até a data de 27 de junho de 2022. Por meio do avanço da tecnologia, técnicas robustas de análise de dados surgiram e, com o auxílio de profissionais da saúde, cientistas de dados são capazes de analisar as consequências geradas pela Covid-19. A fim de realizar o estudo de como a doença afetou os pacientes confirmados com o vírus no município de Vitória, Espírito Santo, este trabalho realiza o pré processamento da base de dados com os casos registrados. Após o pré processamento, os dados são utilizados em modelos de aprendizado de máquina como árvore de decisão, floresta aleatória, XGBoost e AdaBoost, com o intuito de classificar um novo paciente de acordo com sua chance de sobreviver à infecção do novo coronavírus. Essa classificação é realizada a partir das suas condições inicias de saúde, de acordo com as possibilidades de sobreviver ao vírus dadas as características de cada caso.

ABSTRACT: With the appearance of the new coronavirus, SARS-CoV-2, the world became in a pandemic condition and 6,341,446 deaths were recorded up to June 27, 2022. Through the advancement of technology, robust data analysis techniques emerged, and with the help of health professionals, data scientists can analyze the consequences of Covid-19. In order to carry out the study of how the disease affected patients confirmed with the virus in the city of Vitoria, Espirito Santo, this work performs the pre-processing of the database with the registered cases. After pre-processing, the data was used in machine learning models such as decision trees, random forests, XGBoost, and AdaBoost, to classify a new patient according to their chance of surviving the new coronavirus infection. This classification is carried out based on their initial health conditions, according to the possibilities of surviving the virus given the characteristics of each case.


Collections: