Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.udec.cl/jspui/handle/11594/11565
Título : Desarrollo de un algoritmo de predicción de riesgo de hospitalización, ventilación mecánica e ingreso a UCI en pacientes con COVID-19.
Autor : Figueroa, Rosa
Lagos, María
Arriagada Arroyo, Rocío Valentina
Fecha de publicación : 2022
Editorial : Universidad de Concepción
Resumen : En diciembre de 2019 en la ciudad china de Wuhan comenzó un brote de neumonía asociada al coronavirus SARS-CoV-2. Rápidamente, el virus comenzó a esparcirse por el mundo, estando a la fecha presente en más de 189 países con un saldo aproximado de 397 millones de casos y 5,75 millones de fallecidos. Este trabajo tiene como objetivo desarrollar un algoritmo de predicción de riesgo de hospitalización, ingreso a UCI y ventilación mecánica en pacientes chilenos con COVID-19. Se utilizó una base de datos que contiene 1.062 registros extraídos del Sistema de Vigilancia Epidemiológica Chileno EPIVIGILA del ministerio de salud. De las variables disponibles, se seleccionaron 52 variables predictoras incluyendo 5 variables correspondientes a signos vitales, 20 variables de biomarcadores, 11 variables del tipo comorbilidad y 14 variables del tipo síntomas, sexo y edad; dichas variables serán utilizadas para predecir las variables de salida de riesgo de hospitalización, ingreso a UCI y ventilación mecánica. Sobre este conjunto de variables se realizó un proceso de selección de características usando regresión logística y transformaciones no lineales de splines sobre las variables continuas con el objetivo de identificar de mejor manera las posibles relaciones entre estas variables y las de salida. La selección de los subconjuntos de predictores para cada salida se realizó utilizando el estadístico Wald chi-cuadrado, método con el cual se puede valorar la significancia de un variable a la hora de realizar la predicción. Posteriormente, se utilizaron 3 algoritmos de clasificación: regresión logística (RL), Random Forest (RF)y redes neuronales, se ajustaron sus parámetros con validaciones cruzadas y fueron entrenados. Para evaluar el desempeño de los modelos se utilizó la matriz de confusión y las métricas derivadas de esta, además se trazaron las curvas ROC y PRC para comparar entre modelos. Con RF se identificó el riesgo de hospitalización con un 94% de sensibilidad y un 83,5% de precisión. Para ingreso a UCI se logró un 70,4% de sensibilidad y un 78,1% de precisión con perceptrón multicapa. Con este clasificador de logró identificar el riesgo de ventilación mecánica invasiva con un 69% de sensibilidad y un 80% de precisión. A pesar de los desafíos propios de la clasificación con clases desbalanceadas y las limitaciones dadas por los datos, fue posible obtener modelos de predicción con buenos rendimientos, recordando siempre analizar este punto comparando distintas métricas y analizando la variación de estas para poder obtener una imagen más completa y real del rendimiento de los clasificadores.
In December 2019, an outbreak of pneumonia associated with the SARS-CoV-2 coronavirus began in the Chinese city of Wuhan. Rapidly, the virus began to spread around the world, being to date present in more than 189 countries with an approximate balance of 397 million cases and 5.75 million deaths. The aim of this work is to develop an algorithm for predicting the risk of hospitalization, admission to ICU and mechanical ventilation in Chilean patients with COVID-19. A database containing 1,062 records extracted from the Chilean Epidemiological Surveillance System EPIVIGILA of the Ministry of Health was used. Of the available variables, 52 predictor variables were selected, including 5 variables corresponding to vital signs, 20 biomarker variables, 11 comorbidity-type variables and 14 variables of the symptom, sex and age type; these variables will be used to predict the variables of outcome: hospitalization risk, admission to ICU and mechanical ventilation. A feature selection was performed on this set of variables using logistic regression and nonlinear spline transformations on the continuous variables. These transformations help to better identify the possible relationships between the continuous and output variables. The selection of the subsets of predictors for each output was carried out using the Wald chi-square statistic, a method with which the significance of a variable can be assessed when making the prediction. Subsequently, 3 classification algorithms were used: logistic regression (LR), Random Forest (RF) and neural networks, their parameters were adjusted with cross-validations and trained. To evaluate the performance of the models, the confusion matrix and the metrics derived from it were used, and ROC and PRC curves were plotted to compare between models. With RF, the risk of hospitalization was identified with 94% sensitivity and 83.5% precision. For admission to the ICU, 70.4% sensitivity and 78.1% precision were achieved with multilayer perceptron. With this classifier we were able to identify the risk of invasive mechanical ventilation with 69% sensitivity and 80% precision. Despite the challenges of classification with unbalanced classes and the limitations given by the data, it was possible to obtain predictive models with good performance, always remembering to analyze this point by comparing different metrics and analyzing the variation of these in order to obtain a more complete and truer picture of the performance of the classifiers.
Descripción : Tesis presentada para optar al título de Ingeniera Civil Biomédica.
URI : http://repositorio.udec.cl/jspui/handle/11594/11565
Aparece en las colecciones: Ingeniería Eléctrica - Tesis Pregrado

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Arriagada Arroyo_Rocío Tesis.pdf1,78 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons