Aceleración hardware para inferencia en redes neuronales convolucionales.

Pérez Cerdeira, Ignacio Jesús

Please use this identifier to cite or link to this item: http://repositorio.udec.cl/jspui/handle/11594/6204

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Figueroa Toro, Miguel Ernesto; supervisor de grado	es
dc.contributor.advisor	Carvajal Barrera, Gonzalo Andrés; supervisor de grado	es
dc.contributor.author	Pérez Cerdeira, Ignacio Jesús	es
dc.date.accessioned	2021-06-02T14:00:41Z	-
dc.date.available	2021-06-02T14:00:41Z	-
dc.date.issued	2021	-
dc.identifier.uri	http://repositorio.udec.cl/jspui/handle/11594/6204	-
dc.description	Tesis para optar al grado de Magíster en Ciencias de la Ingeniería con mención en Ingeniería Eléctrica.	es
dc.description.abstract	Gracias a su alta precisión para clasificar objetos en imágenes, las redes neuronales con volucionales (CNN) son una herramienta muy relevante en la visión computacional. Este tipo de red neuronal utiliza capas convolucionales para extraer características de las imágenes y las clasifica por medio de capas de clasificación. Típicamente, el proceso de reconocimiento, llamado inferencia, es aplicado en unidades centrales de procesamiento (CPU) o unidades de procesamiento gráfico (GPU), pero debido al alto paralelismo de estas últimas, las GPUs muestran un mejor desempeño. Aun así, su alto consumo de potencia dificulta la implementación de estas plataformas en dispositivos móviles. Por esto, una alternativa para solucionar este problema es diseñar arquitecturas hardware en sistemas dedicados, como arreglos de compuertas programables (FPGA), que permiten reducir el consumo de potencia y acelerar la inferencia. Debido a esto, en este trabajo diseñamos una arquitectura heterogénea para realizar la inferencia de la CNN MobileNet V2 sobre hardware dedicado. Esta arquitectura utiliza una CPU y memoria embebida para controlar y almacenar datos del proceso, y un acelerador hardware sintetizado en la lógica programable de un FPGA para disminuir los tiempos de inferencia. Para reducir la cantidad de operaciones y datos en la FPGA, utilizamos técnicas de loop tiling, pruning y cuantización. Implementamos la arquitectura sobre la plataforma Xilinx Zynq Ultrascale+, utilizando la CPU ARM Cortex-A53 como controlador, una memoria DDR4 de 2GB para almacenar datos y la FPGA XCZU7EV para sintetizar cuatro elementos de procesamiento que permiten la inferencia en paralelo. Nuestra implementación puede inferir una imagen de la base de datos ImageNet de 224×224 píxeles en 220ms, utilizando 532 bloques de RAM (BRAM), 24 RAMs de UltraScale (URAM) y 340 procesadores digitales de señales (DSP) del FPGA, y consumiendo 7.34W de potencia. Comparada con una implementación software sobre una GPU y CPU, nuestro diseño es 10.18 veces más lento que la GPU y tiene un frame-rate similar a la CPU, pero consume 29.23 y 12.93 veces menos potencia que estos dispositivos respectivamente	es
dc.language.iso	spa	es
dc.publisher	Universidad de Concepción.	es
dc.rights	Creative Commoms CC BY NC ND 4.0 internacional (Atribución-NoComercial-SinDerivadas 4.0 Internacional)	-
dc.rights.uri	https://creativecommons.org/licenses/by-nc-nd/4.0/deed.es	-
dc.subject	Mosaico de Bucle (Ciencia de la Computación)	es
dc.subject	Convoluciones (Matemáticas)	es
dc.subject	Arquitectura de Redes de Computadores	es
dc.subject	Industria, Innovación e Infraestructura	es
dc.title	Aceleración hardware para inferencia en redes neuronales convolucionales.	es
dc.type	Tesis	es
dc.description.facultad	Departamento de Ingeniería Eléctrica	es
dc.description.departamento	Departamento de Ingeniería Eléctrica.	es
Appears in Collections:	Ingeniería Eléctrica - Tesis Magister

Files in This Item:

File	Description	Size	Format
TESIS ACELERACION HARDWARE PARA INFERENCIA EN REDES .Image.Marked.pdf		3,13 MB	Adobe PDF	View/Open

Show simple item record

This item is licensed under a Creative Commons License