Implementación en GPU del algoritmo K-Means para ... - UMBC
Implementación en GPU del algoritmo K-Means para ... - UMBC
Implementación en GPU del algoritmo K-Means para ... - UMBC
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Implem<strong>en</strong>tación</strong> <strong>en</strong> <strong>GPU</strong> <strong>del</strong> <strong>algoritmo</strong> K-<strong>Means</strong> <strong>para</strong> procesami<strong>en</strong>to <strong>para</strong>lelo<br />
de imág<strong>en</strong>es de satélite disponibles <strong>en</strong> la herrami<strong>en</strong>ta Google Maps<br />
5.3 <strong>en</strong> cada multiprocesador t<strong>en</strong>emos 2 bloques activos por tanto los recursos<br />
hardware de ese multiprocesador se compart<strong>en</strong> <strong>en</strong>tre los dos bloques, estos bloque<br />
podrán ejecutarse <strong>en</strong> <strong>para</strong>lelo siempre y cuando ninguno de los dos consuma más de<br />
la mitad de los recursos disponibles. Cada multiprocesador ti<strong>en</strong>e un total de 16K<br />
registros de 32 bits, es decir 16384 registros. La mitad de estos es 8192, t<strong>en</strong>emos <strong>en</strong><br />
un bloque 512 hilos que consum<strong>en</strong> 6 registros cada uno lo que hace un total de 3072<br />
registros, cantidad que no supera la mitad. Como puede verse <strong>en</strong> la gráfica, <strong>en</strong> el<br />
supuesto de que cada hilo utilizase más de 16 registros, la ocupación se reduciría a la<br />
mitad, permiti<strong>en</strong>do solam<strong>en</strong>te la ejecución de un bloque de hilos por<br />
multiprocesador.<br />
Figura 5.4: Cuda occupancy calculator: gráfica asociada al número de registros por hilo.<br />
Finalm<strong>en</strong>te la figura 5.5 muestra la gráfica asociada a la cantidad de memoria<br />
compartida usada por cada bloque.<br />
Trabajo Fin de Máster -59- Sergio Bernabé García