Extracción de información en emr para la identificación de obesidad mediante el estudio de comorbilidades asociadas

dc.contributor.advisorFigueroa Iturrieta, Rosa Lilianaes
dc.contributor.authorFlores Jara, Christopher Alejandroes
dc.date.accessioned2016-09-08T17:41:35Z
dc.date.accessioned2019-12-13T12:30:36Z
dc.date.accessioned2024-05-17T13:48:55Z
dc.date.accessioned2024-08-28T18:48:39Z
dc.date.available2016-09-08T17:41:35Z
dc.date.available2019-12-13T12:30:36Z
dc.date.available2024-05-17T13:48:55Z
dc.date.available2024-08-28T18:48:39Z
dc.date.issued2015
dc.descriptionTesis presentada para optar al título de Ingeniero Civil Biomédico.es
dc.description.abstractEl presente trabajo tuvo la finalidad de identificar obesidad y sus tipos mediante las principales enfermedades asociadas a ella, utilizando registros médicos electrónicos sin identificación de los pacientes, provenientes del Hospital Guillermo Grant Benavente de Concepción en 43 subespecialidades médicas. El problema contempló el estudio de campos estructurados y de texto libre de cada registro médico para una posterior clasificación en dos niveles. El primer nivel correspondió a la identificación de obesidad junto con otros estados nutricionales como el bajo peso, normopeso y sobrepeso. Posteriormente, se procedió a clasificar los tipos de obesidad en las categorías moderada o leve (tipo I), severa (tipo II), mórbida (tipo III) y superobesidad (tipo IV). La clasificación fue realizada en una colección de registros médicos (corpus principal) creada a partir de una recuperación de información de la base de datos, utilizando palabras claves de las categorías del primer nivel de clasificación. Posteriormente, un grupo de anotadores analizó cada registro médico recuperado para etiquetarlos de acuerdo a las clases de ambos niveles, creando un Gold Standard. Para la implementación de los clasificadores Support Vector Machine (SVM) y Naïve Bayes (NB), fue necesaria una representación numérica de cada registro del corpus principal utilizando términos relacionados a las comorbilidades de la obesidad en forma de unigrams y bigrams, a través de una matriz binaria, TF (Term Frequency) y TF-IDF (Term Frequency-Inverse Document Frequency). El más alto desempeño en el primer nivel de clasificación fue el obtenido por SVM con una exactitud igual a 89,10%, utilizando bigrams con una matriz binaria. Por su parte, NB obtuvo en el mismo nivel un porcentaje de exactitud igual a 84,49%, utilizando igual segmentación y representación de la información que SVM. Analizando la clase “obesidad” en particular, el rendimiento de SVM es superior al alcanzado por NB, obteniéndose porcentajes de exactitud iguales a 89,22% y 85,07% respectivamente, en un enfoque basado en bigrams y usando una matriz binaria. En el segundo nivel de clasificación, nuevamente SVM logró el mejor desempeño, alcanzando una exactitud igual a 93,80% mediante bigrams y las matrices TF y TF-IDF para representar la información, mientras que el mejor desempeño de NB fue una exactitud de 82,17% con el mismo tipo de segmentación, pero con una matriz binaria.es
dc.description.campusConcepciónes
dc.description.departamentoDepartamento de Ingeniería Eléctricaes
dc.description.facultadFacultad de Ingenieríaes
dc.identifier.urihttps://repositorio.udec.cl/handle/11594/1954
dc.language.isofrees
dc.publisherUniversidad de Concepciónes
dc.rightsCC BY-NC-ND 4.0 DEED Attribution-NonCommercial-NoDerivs 4.0 Internationalen
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectObesidad - Diagnóstico - Procesamiento de Datoses
dc.subjectRegistros Médicos - Procesamiento de Datoses
dc.titleExtracción de información en emr para la identificación de obesidad mediante el estudio de comorbilidades asociadases
dc.typeTesises

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Tesis_Extraccion_de_Informacion_en_EMR_para_la_Identificacion_de_Obesidad.pdf
Size:
1.19 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Plain Text
Description:

Collections