29.04.2013 Views

Implementación en GPU del algoritmo K-Means para ... - UMBC

Implementación en GPU del algoritmo K-Means para ... - UMBC

Implementación en GPU del algoritmo K-Means para ... - UMBC

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Implem<strong>en</strong>tación</strong> <strong>en</strong> <strong>GPU</strong> <strong>del</strong> <strong>algoritmo</strong> K-<strong>Means</strong> <strong>para</strong> procesami<strong>en</strong>to <strong>para</strong>lelo<br />

de imág<strong>en</strong>es de satélite disponibles <strong>en</strong> la herrami<strong>en</strong>ta Google Maps<br />

experim<strong>en</strong>tos realizados sobre la imag<strong>en</strong> <strong>del</strong> World Trade C<strong>en</strong>ter y com<strong>para</strong>remos<br />

los tiempos de las versiones CPU y <strong>GPU</strong>.<br />

La tabla 6.2 muestra el tiempo de ejecución por cada una de las <strong>GPU</strong>s y la<br />

versión serie, además <strong>del</strong> speedup conseguido.<br />

Parámetros<br />

Núm.<br />

Elem<strong>en</strong>tos<br />

Núm.<br />

Clusters<br />

K-<strong>Means</strong> versión<br />

Tiempo<br />

(segs)<br />

C (CPU)<br />

Speedup Tiempo<br />

(segs)<br />

K-<strong>Means</strong> versión<br />

CUDA (<strong>GPU</strong><br />

GeForce 9400M)<br />

K-<strong>Means</strong> versión<br />

CUDA (<strong>GPU</strong><br />

Tesla c1060)<br />

Speedup Tiempo<br />

(segs) Speedup<br />

512x512 5 0.822 1x 0.252 3.26x 0.145 5.67x<br />

512x512 64 3.769 1x 0.496 7.60x 0.210 17.95x<br />

512x512 128 7.861 1x 0.764 10.29x 0.268 29.33x<br />

1024x1024 64 22.147 1x 3.582 6.18x 0.715 30.97x<br />

1024x1024 128 38.301 1x 4.374 8.76x 1.044 36.69x<br />

Tabla 6.2. Com<strong>para</strong>ción de resultados CPU y <strong>GPU</strong> utilizando la imag<strong>en</strong> <strong>del</strong> World Trade<br />

C<strong>en</strong>ter ajustada según la dim<strong>en</strong>sión.<br />

A medida que aum<strong>en</strong>tamos el número de elem<strong>en</strong>tos, es decir, las dim<strong>en</strong>siones de<br />

la imag<strong>en</strong> a clasificar y el número de clusters, el speedup conseguido por la <strong>GPU</strong><br />

Tesla es cada vez mayor, concretam<strong>en</strong>te la versión <strong>GPU</strong> tarda casi 37 veces m<strong>en</strong>os<br />

<strong>en</strong> ejecutarse que la versión CPU demostrando la gran pot<strong>en</strong>cia de cálculo que puede<br />

aprovecharse <strong>en</strong> una <strong>GPU</strong>. Sin embargo utilizando una <strong>GPU</strong> GeForce 9400M el<br />

límite nos lo <strong>en</strong>contramos al aum<strong>en</strong>tar <strong>en</strong> 1024x1024 las dim<strong>en</strong>siones de la imag<strong>en</strong>,<br />

<strong>en</strong> donde el speedup va disminuy<strong>en</strong>do. Así y todo se ha conseguido ejecutar el<br />

código <strong>en</strong> 10 veces m<strong>en</strong>os que la versión CPU.<br />

Trabajo Fin de Máster -67- Sergio Bernabé García

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!