Descargar - UTP
Descargar - UTP
Descargar - UTP
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
La simulación del algoritmo de detección de<br />
rostros sobre Matlab tiene por objetivo el<br />
conocer hasta el más mínimo detalle cada<br />
procedimiento que involucra el entrenamiento<br />
hasta la ejecución del algoritmo ya entrenado.<br />
Se presenta un diagrama de flujo que explica<br />
el funcionamiento del sistema que se implementará<br />
para el sistema de detección de rostros,<br />
ver figura 15.<br />
El sistema consta de un sensor de imagen (cámara),<br />
que está conectada a la FPGA, la FPGA<br />
internamente tiene implementada un conjunto<br />
de bloques que procesa la información (imagen)<br />
entregada por el sensor de imagen, para<br />
luego mostrar el resultado en una pantalla<br />
LCD, además el sistema controlará actuadores<br />
que activaran alarmas o el abrir y cerrar de<br />
una puerta para el control de acceso.<br />
Fig. 15. Diagrama de flujo del sistema de<br />
detección de rostros.<br />
Sensor de imagen:<br />
- Resolución: 352x288 pixeles.<br />
- Formato de imagen: YCrCb<br />
- Interface paralela: 8bits.<br />
SRAM:<br />
- 512Kbyte<br />
El sensor de imagen (cámara) captura la imagen<br />
enviándola a la FPGA en formato YCrCb<br />
(donde Y representa la luminancia, Cr y Cb son<br />
los componentes de crominancia).<br />
La componente Y representa la imagen en escala<br />
de grises es por eso que solo se utiliza<br />
esta componente, esto nos ahorra el proceso<br />
de convertir una imagen de color a una en escala<br />
de grises.<br />
La FPGA toma los datos (pixeles) obtenidos del<br />
sensor de imagen para luego guardarlos dentro<br />
de la memoria SRAM, una vez guardada la imagen,<br />
el sistema implementado dentro de la FPGA<br />
lee los pixeles dentro de la SRAM para la detección<br />
de un rostro y determinar su ubicación.<br />
Se presenta en la figura 16 el diagrama de bloques<br />
que se implementará en la FPGA.<br />
CIENCIA, CULTURA Y TECNOLOGÍA - UNIVERSIDAD TECNOLÓGICA DEL PERÚ<br />
Fig. 16. Diagrama de bloques en la FPGA.<br />
7. RESULTADOS<br />
La base de datos de 1332 imágenes para el entrenamiento<br />
no fue suficiente y esto provoca<br />
ineficiencia en la detección de rostros como se<br />
observa en la Figura 14. , respecto al tiempo<br />
de detección de rostros en Matlab, la detección<br />
es muy lenta con un tiempo de 5 minutos<br />
aproximadamente dependiendo del tamaño de<br />
la imagen a examinar, este tiempo puede mejorarse<br />
con la utilización de otros lenguajes como<br />
por ejemplo C++ y técnicas de programación.<br />
8. CONCLUSIONES<br />
Se concluye que la eficiencia del Detector de<br />
Rostro depende de la cantidad de datos en la<br />
etapa de entrenamiento.<br />
La combinación de la técnica de Adaboost y<br />
el uso de los filtros Haar para la detección de<br />
rostros y valores característicos disminuyen en<br />
gran medida la cantidad de datos a procesar en<br />
una imagen durante la ejecución del sistema.<br />
9. RECOMENDACIONES<br />
Tener muy en cuenta que el tiempo de entrenamiento<br />
puede durar desde días a semanas,<br />
esto dependiendo del número de imágenes<br />
que se utiliza para el entrenamiento, se recomienda<br />
el uso multi-hilos.<br />
10. AGRADECIMIENTOS<br />
Quiero agradecer a todas las personas que hicieron<br />
posible la realización de este trabajo y<br />
en forma particular al Centro de Investigación<br />
y Desarrollo en Ingeniería (CIDI) de la Facultad<br />
de Ingeniería Electrónica de la Universidad<br />
Tecnológica del Perú por haber facilitado el<br />
local para la realización experimental de este<br />
trabajo y material de desarrollo.<br />
También agradesco al grupo de trabajo del<br />
proyecto FG-NET (Face and Gesture Recognition<br />
Research Network) de la Universidad Técnica<br />
de Munich (Alemania) por compartir su<br />
base de datos de imágenes.<br />
35