Vigilância de surtos de COVID-19 através de mineração de texto aplicada aos registros eletrônicos de saúde [Digital]
Dissertação
Português
616-036.21"20"Covid19
Fortaleza, 2024.
45f.
A pandemia de COVID-19 causou interrupções significativas na vida cotidiana e teve consequências sociais, políticas e financeiras que persistirão por anos. Diversas iniciativas com uso intensivo de tecnologia foram rapidamente desenvolvidas nesse cenário. No entanto, são escassas as tecnologias que...
Ver mais
A pandemia de COVID-19 causou interrupções significativas na vida cotidiana e teve consequências sociais, políticas e financeiras que persistirão por anos. Diversas iniciativas com uso intensivo de tecnologia foram rapidamente desenvolvidas nesse cenário. No entanto, são escassas as tecnologias que aprimoram a vigilância epidemiológica em contextos com baixa capacidade de testagem e recursos de saúde limitados. Portanto, este estudo tem como objetivo abordar essa lacuna, desenvolvendo um modelo de ciência de dados que utiliza registros de atendimentos de saúde gerados rotineiramente para detectar possíveis novos surtos de forma precoce e em tempo real. Definiu-se um indicador epidemiológico que serve como proxy para casos suspeitos de COVID-19 usando os registros de saúde de pacientes das Unidades de Pronto Atendimento (UPAs) e técnicas de mineração de texto. O conjunto de dados aberto compreende 2.760.862 registros médicos de nove UPAs, onde cada registro contém informações sobre a idade do paciente, sintomas relatados e a hora e data de admissão. Também foi utilizado um conjunto de dados onde 1.026.804 casos de COVID-19 foram oficialmente confirmados. Os registros variam de janeiro de 2020 a maio de 2022. A correlação cruzada amostral entre duas séries temporais estocásticas finitas foi utilizada para avaliar os modelos. Para pacientes com idade = 18 anos, encontramos atraso temporal t = 72 dias e correlação cruzada ?ˆi,j ~ 0, 82, t = 25 dias e ?ˆi,j ~ 0, 93, e t = 17 dias e ?ˆi,j ~ 0, 88 para a primeira, segunda e terceira ondas, respectivamente. Em suma, mostrou-se que o modelo desenvolvido pode auxiliar na detecção precoce de sinais de possíveis novos surtos de COVID-19, semanas antes dos sistemas tradicionais de vigilância, antecipando assim a implementação de ações preventivas e de controle em saúde pública com uma maior probabilidade de sucesso.
Palavras-chave: COVID-19. Vigilância em Saúde Pública. Ciência de Dados. Mineração de Texto. Correlação Cruzada. Ver menos
Palavras-chave: COVID-19. Vigilância em Saúde Pública. Ciência de Dados. Mineração de Texto. Correlação Cruzada. Ver menos
The COVID-19 pandemic has caused significant disruptions to everyday life and has had social, political, and financial consequences that will persist for years. Several initiatives with intensive use of technology were quickly developed in this scenario. However, technologies that enhance...
Ver mais
The COVID-19 pandemic has caused significant disruptions to everyday life and has had social, political, and financial consequences that will persist for years. Several initiatives with intensive use of technology were quickly developed in this scenario. However, technologies that enhance epidemiological surveillance in contexts with low testing capacity and healthcare resources are scarce. Therefore, this study aims to address this gap by developing a data science model that uses routinely generated healthcare encounter records to detect possible new outbreaks early in real-time. We defined an epidemiological indicator that is a proxy for suspected cases of COVID-19 using the health records of Emergency Care Unit (ECU) patients and text mining techniques. The open-field dataset comprises 2,760,862 medical records from nine ECUs, where each record has information about the patient’s age, reported symptoms, and the time and date of admission. We also used a dataset where 1,026,804 cases of COVID-19 were officially confirmed. The records range from January 2020 to May 2022. Sample cross-correlation between two finite stochastic time series was used to evaluate the models. For patients with age = 18 years, we find time-lag t = 72 days and cross-correlation ?ˆi,j ~ 0, 82, t = 25 days and ?ˆi,j ~ 0, 93, and t = 17 days and ?ˆi,j ~ 0, 88 for the first, second, and third waves, respectively. In conclusion, the developed model can aid in the early detection of signs of possible new COVID-19 outbreaks, weeks before traditional surveillance systems, thereby anticipating in initiating preventive and control actions in public health with a higher likelihood of success.
Keywords: COVID-19. Public Health Surveillance. Data Science. Text Mining. Crosscorrelation. Ver menos
Keywords: COVID-19. Public Health Surveillance. Data Science. Text Mining. Crosscorrelation. Ver menos
Oliveira, Erneson Alves de
Orientador
Rocha, Hermano Alexandre Lima
Banca examinadora
Pires, Rilder de Sousa
Banca examinadora
Universidade de Fortaleza. Programa de Pós-Graduação em Informática Aplicada
Dissertação (mestrado)