Implementación en GPU del algoritmo K-Means para ... - UMBC

More documents

Recommendations

Info

Implementación en GPU del algoritmo KK-Means Means para procesamiento paralelo de imágenes de satélite disponibles en la herramienta Google MMaps Ejemplo: copia CPU GPU. Las primitivas utilizadas son las siguientes: • cudaMalloc: : asigna size bytes de memoria lineal en el dispositivo y vuelve en *devPtr un puntero a la memoria asignada. La memoria asignada está convenientemente preparada para cualquier tipo de variable. cudaMalloc() devuelve cudaErrorMemory cudaErrorMemoryAllocation, la a memoria no se borra. cudaMalloc () devuelve cudaErrorMemoryAllocation cudaErrorMemoryAllocation, en caso de fallo. La función se define de la siguiente forma: cudaError_t cudaMalloc (voiod **devPtr, size_t tamaño) • cudaMemset: : rellena el primer count byte del área de memoria apuntada por devPtr con el valor cconstante value. La función se define de la siguiente forma: cudaError_t cudaMemset (voiod *devPtr, int valor, size_t nbytes) • cudaFree: libera ibera el espacio de memoria apuntado por devPtr , que debe haber sido devuelto por una llamada previa a cudaMalloc () o cudaMallocPitch () (). De lo contrario devolverá un error. Si devPtr es 0, no realiza realizará ninguna operación. CudaFree udaFree () devuelve cudaErrorInvalidDevicePointer en caso de fallo. La función se define de la siguiente forma: cudaError_t cudaFree (void *devPtr) • cudaMemCpy cudaMemCpy: copia count bytes desde el área de memoria apuntada por src al área de memoria apuntada por dst, donde kind es uno de los siguientes Trabajo Fin de Máster -88- Sergio Bernabé García
Implementación en GPU del algoritmo K-Means para procesamiento paralelo de imágenes de satélite disponibles en la herramienta Google Maps modificadores: cudaMemcpyHostToHost, cudaMemcpyHostToDevice, cudaMemcpyDeviceToHost o cudaMemcpyDeviceToDevice, y especifican la dirección de la copia. Las áreas de memoria no se pueden solapar. cudaError_t cudaMemcpy (void *dst, const void *src, size_t nbytes, enum MODELO DE PROGRAMACIÓN: cudaMemcpyKind kind) Los kernels son funciones invocadas desde el host y ejecutadas en paralelo sobre el device empleando GPU threads. Características: • Paralelismo a nivel de datos. • Agrupación de threads. • Block: thread ∈ block. o Compartir datos. o Sincronizar ejecución. • Grid: # blocks. o Dominio de cálculo. • Tamaño block y grid se decide en la invocación del kernel. Otro aspecto utilizado en el modelo de programación son las dimensiones e identificadores: • Grid (hasta 2D), block (hasta 3D), tipos dim3. • Ejemplos (ver figura 8.3): Trabajo Fin de Máster -89- Sergio Bernabé García
Page 1 and 2:
UNIVERSIDAD DE EXTREMADURA Escuela
Page 3 and 4:
Implementación en GPU del algoritm
Page 5 and 6:
Page 7 and 8:
Page 9 and 10:
Page 11 and 12:
Page 13 and 14:
Page 15 and 16:
Page 17 and 18:
Page 19 and 20:
Page 21 and 22:
Page 23 and 24:
Page 25 and 26:
Page 27 and 28:
Page 29 and 30:
Page 31 and 32:
Page 33 and 34:
Page 35 and 36:
Page 37 and 38: Implementación en GPU del algoritm
Page 87: Implementación en GPU del algoritm
show all

Implementación en GPU del algoritmo K-Means para ... - UMBC

Create successful ePaper yourself

Delete template?

Save as template?