PDF(1,9MB) - Está é a máquina do Professor Alfredo Goldman (this ...
PDF(1,9MB) - Está é a máquina do Professor Alfredo Goldman (this ...
PDF(1,9MB) - Está é a máquina do Professor Alfredo Goldman (this ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Compute Capability<br />
Especificações t<strong>é</strong>cnicas 1.0 1.1 1.2 1.3 2.x<br />
Dimensão máxima de um grid 2 3<br />
Dimensão máxima de um bloco 3<br />
Número máximo de threads por bloco 512 1024<br />
Tamanho <strong>do</strong> warp 32<br />
Número máximo de blocos residentes 8<br />
em um multiprocessa<strong>do</strong>r<br />
Número máximo de warps residentes 24 32 48<br />
em um multiprocessa<strong>do</strong>r<br />
Número máximo de threads residentes 768 1024 1536<br />
em um multiprocessa<strong>do</strong>r<br />
Número de registra<strong>do</strong>res 32-bit 8 K 16 K 32 K<br />
por multiprocessa<strong>do</strong>r<br />
Quantidade máxima de memória 16 KB 48 KB<br />
compartilhada por multiprocessa<strong>do</strong>r<br />
Quantidade de memória local 16 KB 512 KB<br />
por thread<br />
Número máximo de instruções 2 milhões<br />
3.4.5 Exemplo<br />
por kernel<br />
Código 3: Soma <strong>do</strong>is vetores A e B, de dimensão N, e coloca o resulta<strong>do</strong> no<br />
vetor C<br />
// d e f i n i c a o <strong>do</strong> k e r n e l<br />
{<br />
g l o b a l void vecAdd ( f loat ∗ A, float ∗ B, float ∗ C)<br />
int i = blockDim . x ∗ blockIdx . x + threadIdx . x ;<br />
5 i f ( i < N)<br />
47