30.07.2015 Views

Actas JP2011 - Universidad de La Laguna

Actas JP2011 - Universidad de La Laguna

Actas JP2011 - Universidad de La Laguna

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Actas</strong> XXII Jornadas <strong>de</strong> Paralelismo (<strong>JP2011</strong>) , <strong>La</strong> <strong>La</strong>guna, Tenerife, 7-9 septiembre 2011En el ámbito <strong>de</strong> la evaluación <strong>de</strong> sistemasheterogéneos una característica esencial aparte<strong>de</strong> la diversidad <strong>de</strong> tests es la disponibilidad <strong>de</strong>implementaciones tanto para CPUs multi-núcleocomo para GPUs. Con estas condiciones, una <strong>de</strong>las pocas alternativas a Rodinia está representadapor el benchmark SHOC [12] que se centra en testsprogramados en OpenCL. En este trabajo hemosoptado por utilizar Rodinia <strong>de</strong>bido a que fue elprimer benchmark <strong>de</strong> estas características en estardisponible y también porque el rendimiento sobreGPUs <strong>de</strong> NVIDIA es superior utilizando CUDA queOpenCL [13], pero no <strong>de</strong>scartamos utilizar otrasalternativas en el futuro.<strong>La</strong> selección <strong>de</strong> los tests individuales quecomponen el benchmark Rodinia ha estado guiadapor la taxonomía introducida en [14], en laque el espectro <strong>de</strong> aplicaciones susceptibles <strong>de</strong>precisar CAP se caracteriza atendiendo a 13diferentes mo<strong>de</strong>los (dwarfs), cada uno <strong>de</strong> los cualesrepresenta un <strong>de</strong>terminado patrón <strong>de</strong> cómputoy comunicaciones común a toda una clase <strong>de</strong>aplicaciones relevantes. De este modo se persigueque estos 13 mo<strong>de</strong>los estén representados en elbenchmark. Aparte <strong>de</strong> la diversidad <strong>de</strong> mo<strong>de</strong>los,también se ha buscado que los tests correspondana diversos dominios <strong>de</strong> aplicación: bioinformática,minería <strong>de</strong> datos, simulaciones físicas, proceso <strong>de</strong>imágenes, reconocimiento <strong>de</strong> patrones, etc.Describimos brevemente a continuación cada uno<strong>de</strong> los tests <strong>de</strong> Rodinia que hemos utilizado ennuestros experimentos. Información adicional sobrecada uno <strong>de</strong> ellos se pue<strong>de</strong> encontrar en los propiostrabajos <strong>de</strong>l grupo <strong>de</strong>l profesor Skadron [6].Back Propagation (BP): Es un algoritmo <strong>de</strong>entrenamiento para re<strong>de</strong>s neuronales. <strong>La</strong> aplicaciónque se incorpora en el Benchmark se compone <strong>de</strong>dos etapas: la primera <strong>de</strong> ellas, Forward Phase,en la que los valores a la entrada se propaganhacia a<strong>de</strong>lante para calcular la salida y la segunda,Bacward Phase, en el que se calcula el error entre lasalida <strong>de</strong> la red y la que <strong>de</strong>bería haberse obtenido,propagándose hacia atrás.Breadth-First Search (BFS): Es un algoritmo pararecorrer o buscar elementos en un grafo, aunquefrecuentemente se usa sobre árboles. Se comienzaen la raíz (eligiendo algún nodo como elemento raízen el caso <strong>de</strong> un grafo) y se exploran todos losvecinos <strong>de</strong> este nodo. A continuación para cada uno<strong>de</strong> los vecinos se exploran sus respectivos vecinosadyacentes, y así hasta que se recorra todo el árbol.CFD: Es un algoritmo <strong>de</strong>l ámbito <strong>de</strong> la mecánica<strong>de</strong> fluidos computacional. Resuelve las ecuaciones <strong>de</strong>Euler en tres dimensiones para fluidos compresiblesen volúmenes finitos.Heartwall (HW): Es una aplicación que <strong>de</strong>tectacambios <strong>de</strong> forma <strong>de</strong> las pare<strong>de</strong>s <strong>de</strong>l corazón <strong>de</strong> unratón. Recibe como entrada un ví<strong>de</strong>o <strong>de</strong> ultrasonidos<strong>de</strong>l corazón <strong>de</strong> dicho animal y realiza múltiplesoperaciones (<strong>de</strong>tección <strong>de</strong> bor<strong>de</strong>s, transformacionesmorfológicas, filtro SRAD) para <strong>de</strong>tectar la paredinterna y externa <strong>de</strong>l corazón. Una vez <strong>de</strong>tectados,el programa sigue los cambios <strong>de</strong> las pare<strong>de</strong>s en lossucesivos frames <strong>de</strong>l ví<strong>de</strong>o.Hotspot (HS): Algoritmo que estima latemperatura en cada zona <strong>de</strong> un procesadorbasándose en su arquitectura y en medidas <strong>de</strong>potencia. <strong>La</strong> entrada <strong>de</strong>l programa son lastemperaturas y potencias iniciales y la salida es latemperatura media <strong>de</strong> cada zona <strong>de</strong>l procesador.K-means (KM): Es uno <strong>de</strong> los algoritmos nosupervisados más simples para resolver el conocidoproblema <strong>de</strong>l clustering. El objetivo es clasificar uncierto número <strong>de</strong> observaciones en un conjunto <strong>de</strong>clusters <strong>de</strong> modo que cada observación pertenezcaal cluster que tenga la media más cercana. Cada vezque se aña<strong>de</strong> un dato a un cluster se recalculan suspropieda<strong>de</strong>s y se sigue iterando hasta converger.Leukocyte (LC): Aplicación médica cuyo objetivoconsiste en <strong>de</strong>tectar y seguir la trayectoria <strong>de</strong> losleucocitos (glóbulos blancos) en un ví<strong>de</strong>o <strong>de</strong> los vasossanguíneos grabado a través <strong>de</strong> un microscopio. Enla aplicación, las células se <strong>de</strong>tectan en los primerosfotogramas <strong>de</strong>l ví<strong>de</strong>o y se siguen a través <strong>de</strong> losfotogramas posteriores.Descomposición LU (LUD): <strong>La</strong> <strong>de</strong>scomposición LUes un algoritmo para calcular las soluciones <strong>de</strong>un conjunto <strong>de</strong> ecuaciones lineales. El núcleo <strong>de</strong>lalgoritmo <strong>de</strong>scompone una matriz como producto<strong>de</strong> una matriz triangular inferior por una matriztriangular superior.Needleman-Wunsch (NW): Se trata <strong>de</strong> un método<strong>de</strong> optimización para el alineamiento <strong>de</strong> unasecuencia <strong>de</strong> ADN. Dicho alineamiento consiste enorganizar las secuencias <strong>de</strong> ADN <strong>de</strong> modo que laspartes más similares estén enfrentadas entre sí. Elalgoritmo NW es un método global (se intenta alinearla secuencia completa) basado en programacióndinámica. Se utiliza una matriz <strong>de</strong> sustituciónpara asignar puntuaciones según las coinci<strong>de</strong>nciaso diferencias entre los aminoácidos. Usando dichamatriz el algoritmo calcula el alineamiento óptimo.Particlefilter (PF): El filtro <strong>de</strong> partículas es unestimador estadístico <strong>de</strong> la posición <strong>de</strong> un objeto quese obtiene a partir <strong>de</strong> medidas <strong>de</strong> esta posición quecontienen ruido, así como <strong>de</strong> la trayectoria <strong>de</strong>l objetoen un entorno bayesiano. El PF tiene multitud <strong>de</strong>aplicaciones prácticas: seguimiento <strong>de</strong> vehículos enun ví<strong>de</strong>o o compresión <strong>de</strong> ví<strong>de</strong>o son algunas <strong>de</strong> ellas.<strong>La</strong> implementación específica que se incluye en elbenchmark está optimizada para el seguimiento <strong>de</strong>células; específicamente leucocitos y células <strong>de</strong>l tejidomiocardial.SRAD: Es un algoritmo que usando ecuaciones en<strong>de</strong>rivadas parciales trata <strong>de</strong> eliminar las manchas <strong>de</strong>una imagen tratando <strong>de</strong> preservar las característicasimportantes <strong>de</strong> la imagen. SRAD es ampliamenteutilizado en ultrasonidos y aplicaciones <strong>de</strong> imágenes<strong>de</strong> radar.Streamcluster (SC): Para un conjunto <strong>de</strong> puntos<strong>de</strong> entrada, el algoritmo genera un númeropre<strong>de</strong>terminado <strong>de</strong> grupos que cumplen que la<strong>JP2011</strong>-662

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!