Repositorio Dspace

Acelerador hardware para búsqueda de motivos emergentes en streams de secuencias de ADN

Mostrar el registro sencillo del ítem

dc.contributor.advisor Hernández Rivas, Cecilia; supervisora de grado es
dc.contributor.author Saavedra Mondaca, Antonio Sebastián es
dc.date.accessioned 2019-01-10T20:07:39Z
dc.date.accessioned 2019-12-13T12:03:13Z
dc.date.available 2019-01-10T20:07:39Z
dc.date.available 2019-12-13T12:03:13Z
dc.date.issued 2018
dc.identifier.other 238230
dc.identifier.uri http://repositorio.udec.cl/jspui/handle/11594/3269
dc.description Magister en Ciencias de la Ingeniería con mención en Ingeniería Eléctrica Universidad de Concepción 2018 es
dc.description.abstract El descubrimiento de motivos en cadenas de ADN se define como la búsqueda de secuencias cortas de elementos compartidos en un conjunto largo de bases de nucleótidos que poseen una función biológica común. El descubrimiento de motivos entre los sitios de unión de los factores de transcripción, debido a la importancia de su función regulatoria en la expresión genética, resulta un problema de relevancia biológica. Este tipo de problemas presenta una alta complejidad computacional, especialmente debido a las dificultad de trabajar con bases de datos masivas. Las soluciones existentes en este tipo de problema se enfocan, por lo general, a plataformas en grandes clusters de alto costo, elevados tiempos de ejecución y consumo de potencia. En este trabajo se desarrolla un acelerador hardware reconfigurable para la búsqueda de motivos emergentes en secuencias de ADN. Los motivos emergentes se definen como aquellos que cumplen requisitos establecidos de frecuencia dentro de la secuencias analizadas. Su búsqueda representa un problema biológicamente relevante que presenta altos requisitos de memoria y costos computacionales. La plataforma se propone en base a algoritmos capaces de resolver el problema de la búsqueda de elementos más frecuentes dentro de un stream de datos. Estos algoritmos utilizan estructuras de datos conocidas como sketches para realizar una aproximación al proceso de conteo para determinar los elementos más frecuentes. A diferencia de un conteo tradicional, la utilización de sketches permite resolver, a través de procesos probabilísticos, en espacio sublineal, la estimación de la frecuencia de cada elemento del stream. Se implementaron en software los algoritmos CountSketch, Countmin, y Countmin-CU. Utilizando bases de datos biológicas públicas, se analizaron las dimensiones requeridas para operar con buena precisión y sensibilidad. El algoritmo Countmin-CU es capaz de encontrar los motivos emergentes de largos entre 10 y 20 utilizando arreglos de 65 mil contadores. El conteo tradicional requeriría sobre 100 mil millones. Se diseñó una arquitectura hardware dedicada que permite utilizar un FPGA como acelerador en un contexto de computación heterogénea. El algoritmo de streaming logra un balance adecuado entre el cómputo y los accesos requeridos a memoria permitiendo explotar el paralelismo fino de este tipo de plataforma. De esta manera, la lógica programable del FPGA con un diseño especializado nos permite reducir los costos de tiempo y el consumo de potencia de la solución. Este modelo de computación acelerada por hardware, con el FPGA nos permite trabajando con un reloj de 300MHz y consumiendo 3 Watts de potencia, nos permite alcanzar una aceleración de hasta 290 veces sobre la versión en software. es
dc.language.iso spa es
dc.publisher Universidad de Concepción. es
dc.rights Creative Commoms CC BY NC ND 4.0 internacional (Atribución-NoComercial-SinDerivadas 4.0 Internacional)
dc.rights.uri https://creativecommons.org/licenses/by-nc-nd/4.0/deed.es
dc.subject Computadores es
dc.subject Bioinformática es
dc.subject Algoritmos Computacionales es
dc.title Acelerador hardware para búsqueda de motivos emergentes en streams de secuencias de ADN es
dc.type Tesis es
dc.description.facultad Departamento de Ingeniería Eléctrica es
dc.description.departamento Departamento de Ingeniería Eléctrica. es


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Creative Commoms CC BY NC ND 4.0 internacional (Atribución-NoComercial-SinDerivadas 4.0 Internacional) Excepto si se señala otra cosa, la licencia del ítem se describe como Creative Commoms CC BY NC ND 4.0 internacional (Atribución-NoComercial-SinDerivadas 4.0 Internacional)

Buscar en DSpace


Búsqueda avanzada

Listar

Mi cuenta