Implementación en GPU del algoritmo K-Means para ... - UMBC
Implementación en GPU del algoritmo K-Means para ... - UMBC
Implementación en GPU del algoritmo K-Means para ... - UMBC
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Implem<strong>en</strong>tación</strong> <strong>en</strong> <strong>GPU</strong> <strong>del</strong> <strong>algoritmo</strong> K-<strong>Means</strong> <strong>para</strong> procesami<strong>en</strong>to <strong>para</strong>lelo<br />
de imág<strong>en</strong>es de satélite disponibles <strong>en</strong> la herrami<strong>en</strong>ta Google Maps<br />
experim<strong>en</strong>tos realizados sobre la imag<strong>en</strong> <strong>del</strong> World Trade C<strong>en</strong>ter y com<strong>para</strong>remos<br />
los tiempos de las versiones CPU y <strong>GPU</strong>.<br />
La tabla 6.2 muestra el tiempo de ejecución por cada una de las <strong>GPU</strong>s y la<br />
versión serie, además <strong>del</strong> speedup conseguido.<br />
Parámetros<br />
Núm.<br />
Elem<strong>en</strong>tos<br />
Núm.<br />
Clusters<br />
K-<strong>Means</strong> versión<br />
Tiempo<br />
(segs)<br />
C (CPU)<br />
Speedup Tiempo<br />
(segs)<br />
K-<strong>Means</strong> versión<br />
CUDA (<strong>GPU</strong><br />
GeForce 9400M)<br />
K-<strong>Means</strong> versión<br />
CUDA (<strong>GPU</strong><br />
Tesla c1060)<br />
Speedup Tiempo<br />
(segs) Speedup<br />
512x512 5 0.822 1x 0.252 3.26x 0.145 5.67x<br />
512x512 64 3.769 1x 0.496 7.60x 0.210 17.95x<br />
512x512 128 7.861 1x 0.764 10.29x 0.268 29.33x<br />
1024x1024 64 22.147 1x 3.582 6.18x 0.715 30.97x<br />
1024x1024 128 38.301 1x 4.374 8.76x 1.044 36.69x<br />
Tabla 6.2. Com<strong>para</strong>ción de resultados CPU y <strong>GPU</strong> utilizando la imag<strong>en</strong> <strong>del</strong> World Trade<br />
C<strong>en</strong>ter ajustada según la dim<strong>en</strong>sión.<br />
A medida que aum<strong>en</strong>tamos el número de elem<strong>en</strong>tos, es decir, las dim<strong>en</strong>siones de<br />
la imag<strong>en</strong> a clasificar y el número de clusters, el speedup conseguido por la <strong>GPU</strong><br />
Tesla es cada vez mayor, concretam<strong>en</strong>te la versión <strong>GPU</strong> tarda casi 37 veces m<strong>en</strong>os<br />
<strong>en</strong> ejecutarse que la versión CPU demostrando la gran pot<strong>en</strong>cia de cálculo que puede<br />
aprovecharse <strong>en</strong> una <strong>GPU</strong>. Sin embargo utilizando una <strong>GPU</strong> GeForce 9400M el<br />
límite nos lo <strong>en</strong>contramos al aum<strong>en</strong>tar <strong>en</strong> 1024x1024 las dim<strong>en</strong>siones de la imag<strong>en</strong>,<br />
<strong>en</strong> donde el speedup va disminuy<strong>en</strong>do. Así y todo se ha conseguido ejecutar el<br />
código <strong>en</strong> 10 veces m<strong>en</strong>os que la versión CPU.<br />
Trabajo Fin de Máster -67- Sergio Bernabé García