Repositorio Dspace

Algoritmos paralelos para sketches de cardinalidad y cuentas.

Mostrar el registro sencillo del ítem

dc.contributor.advisor Hernández Rivas, Cecilia es
dc.contributor.advisor Figueroa Toro, Miguel es
dc.contributor.author Salini Irribarra, Estefano Alessandro es
dc.date.accessioned 2024-01-15T12:17:07Z
dc.date.available 2024-01-15T12:17:07Z
dc.date.issued 2024
dc.identifier.uri http://repositorio.udec.cl/jspui/handle/11594/11753
dc.description Tesis presentada para optar al título profesional de Ingeniero Civil Informático. es
dc.description.abstract El trabajo exploró el uso de algoritmos de streaming en el contexto de tráficos de red, estimándose la entropía de esta ya que es una medida que sirve para detectar ataques de red. Se implementaron algoritmos de streaming con sketches para la estimación de frecuencias y entropía de trazas de red, con el propósito de mejorar el tiempo de ejecución, el uso de memoria, y/o la precisión en la estimación. Se utilizan sketches ya que los streams de datos son muy grandes, y no es factible guardar en memoria la frecuencia de cada elemento del stream. La solución actual utiliza el sketch CountMin-CU junto a colas de prioridad de tamaño estático (que descartan los elementos menos frecuentes cuando la estructura esta llena y se inserta un nuevo elemento), para la estimación de frecuencias, junto al sketch HyperLogLog, para la estimación de la cardinalidad, para así en conjunto estimar la entropía. Se probó utilizar una modificación que extiende el algoritmo HyperLogLog, permitiendo calcular el histograma de frecuencias de una muestra del stream de datos, para estimar la entropía total y la contribución a la entropía de los elementos descartados por las colas de prioridad asociadas al sketch CountMin-CU. Se propuso también utilizar múltiples sketches CountMin-CU o TowerSketch-CU en conjunto con el sketch HyperLogLog para estimar la entropía. Nuestra implementación del sketch HyperLogLog fue modificada para reducir el uso de memoria en un 33 %. Se encontró que el algoritmo que extiende el sketch HyperLogLog guarda una muestra relativamente representativa del stream de datos, pero que la estimación de la entropía mediante el uso de esta muestra da malos resultados. Se encontró que no hay diferencias en la estimación de la entropía mediante el uso de uno o múltiples sketches CountMin-CU o TowerSketch-CU. Sin embargo, el uso de múltiples sketches CountMin-CU o TowerSketch-CU permite la lectura paralela de las trazas de red mediante OpenMP. Se probó también el algoritmo HyperLogLogLog, una modificación al algoritmo HyperLogLog que reduce el uso de memoria. Se encontró que no reduce el uso de memoria más que nuestra implementación del sketch Hyper-LogLog. Nuestros resultados indican que implementar el algoritmo utilizando múltiples sketches en una arquitectura con múltiples pipelines (equivalentes a hebras de CPU) reduciría el tiempo de ejecución. es
dc.language.iso es es
dc.publisher Universidad de Concepción es
dc.rights.uri https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1 en
dc.title Algoritmos paralelos para sketches de cardinalidad y cuentas. es
dc.type Tesis es
dc.description.facultad Facultad de Ingeniería. es
dc.description.departamento Departamento de Ingeniería Informática y Ciencias de la Computación es
dc.description.campus Concepción. es


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1 Excepto si se señala otra cosa, la licencia del ítem se describe como https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1

Buscar en DSpace


Búsqueda avanzada

Listar

Mi cuenta