11.01.2013 Views

PDF(1,9MB) - Está é a máquina do Professor Alfredo Goldman (this ...

PDF(1,9MB) - Está é a máquina do Professor Alfredo Goldman (this ...

PDF(1,9MB) - Está é a máquina do Professor Alfredo Goldman (this ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Compute Capability<br />

Especificações t<strong>é</strong>cnicas 1.0 1.1 1.2 1.3 2.x<br />

Dimensão máxima de um grid 2 3<br />

Dimensão máxima de um bloco 3<br />

Número máximo de threads por bloco 512 1024<br />

Tamanho <strong>do</strong> warp 32<br />

Número máximo de blocos residentes 8<br />

em um multiprocessa<strong>do</strong>r<br />

Número máximo de warps residentes 24 32 48<br />

em um multiprocessa<strong>do</strong>r<br />

Número máximo de threads residentes 768 1024 1536<br />

em um multiprocessa<strong>do</strong>r<br />

Número de registra<strong>do</strong>res 32-bit 8 K 16 K 32 K<br />

por multiprocessa<strong>do</strong>r<br />

Quantidade máxima de memória 16 KB 48 KB<br />

compartilhada por multiprocessa<strong>do</strong>r<br />

Quantidade de memória local 16 KB 512 KB<br />

por thread<br />

Número máximo de instruções 2 milhões<br />

3.4.5 Exemplo<br />

por kernel<br />

Código 3: Soma <strong>do</strong>is vetores A e B, de dimensão N, e coloca o resulta<strong>do</strong> no<br />

vetor C<br />

// d e f i n i c a o <strong>do</strong> k e r n e l<br />

{<br />

g l o b a l void vecAdd ( f loat ∗ A, float ∗ B, float ∗ C)<br />

int i = blockDim . x ∗ blockIdx . x + threadIdx . x ;<br />

5 i f ( i < N)<br />

47

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!