23.01.2015 Views

Apostilas Processadores CORE.pdf

Apostilas Processadores CORE.pdf

Apostilas Processadores CORE.pdf

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

3<br />

Duo Core<br />

Autor:<br />

Luciano Pinheiro dos Santos


4<br />

História do Core Duo<br />

A idéia de processamento duplo adota-se já faz tempo. Esse emprego é mais<br />

perceptível nos computadores de grande porte, servidores ou estações de trabalho,<br />

mais conhecido como Mainframes, onde se trabalha com dois ou mais<br />

processadores acoplado em uma placa mãe. O interessante a ser frisado é que<br />

esses processadores são alocados em soquetes diferentes na placa e não em uma<br />

mesma pastilha, como realizado nos modelos duais atuais.<br />

Antigamente uma das principais preocupações dos fabricantes desses<br />

produtos era com a velocidade (freqüência do clock) de processamento. Mas os<br />

mesmos perceberam que essa busca poderia sim ser alcançada, contudo este<br />

processo resultaria em um consumo de energia muito alto e em conseqüência<br />

também uma dissipação alarmante de calor. Para um consumidor utilitário de<br />

desktop ficaria inviável a refrigeração desse processador, além do custo final ficar<br />

bastante elevado.<br />

Deixando o raciocínio de elevar o clock, a lógica agora é duplo<br />

processamento e redução de energia. Esta técnica consiste em acoplar dois<br />

processadores em uma mesma pastilha. Estes trabalharam ao mesmo tempo para a<br />

realização da mesma tarefa, logo esse trabalho será concluído bem mais rápido que<br />

apenas um processador. Este ganho de performance é melhor visualizado ao se<br />

trabalhar com com várias tarefas.<br />

Pensando desta forma os dois principais fabricantes desses componentes,<br />

Intel e AMD, lançaram seus produtos com essa tecnologia. Os primeiros<br />

lançamentos da intel baseado nessa tecnologia foi o Pentium D e o Pentium<br />

Extreme Edition, ocorrido em 2005. Ambos são baseados em uma tecnologia de<br />

núcleo denominada de NetBurst, a qual foi herdada do Pentium 4, ela tem o objetivo<br />

de proporcionar maior freqüência de clock. A principal diferença entre os dois é que<br />

o segundo além de ter dois núcleos, possui também a tecnologia Hyper Treading<br />

armazenada nesses núcleos, esta se comporta como dois processadores reais, mas<br />

no entanto, são processadores virtuais. Portanto o Sistema operacional irá<br />

reconhecê-lo como quatro processadores. Em 2006 a Intel lança novos<br />

processadores: o Core 2 Duo, o Core 2 Quad e o Core 2 Extreme, estes por sua vez<br />

são baseados em uma nova tecnologia criada pela mesma e batizada de Core. Esta,


5<br />

agora, visa redução do consumo de energia concomitante a um maior poder de<br />

processamento. Esta tecnologia permite desativar parte do processador que não<br />

esta sendo utilizado, desta forma usa somente o potencial necessário a realização<br />

da tarefa.<br />

O período de lançamento dos processadores duais da AMD foi também em<br />

2005. Esses modelos foram o Opteron e o Athlon X2, o primeiro é pra servidor e o<br />

segundo para desktop. A AMD também pensa em projetar outros processadores,<br />

agora com quatro núcleos. Nesta nova proposta será implantado duas pastilhas em<br />

socketes diferentes, sendo que cada pastilha conterá dois processadores, assim<br />

totalizando quatro processadores. Logo o ganho de desempenho deste será bem<br />

acentuado.<br />

De acordo com as informações colhidas, observa-se que esses<br />

processadores é tão recente que não há muita história a ser contada. O que<br />

percebe-se, na verdade, é um constante aparecimento de novos modelos de<br />

processadores, tanto pelo lado da Intel quanto da AMD, com características<br />

diferentes e muito mais poderosos que os anteriores, contribuindo assim para que<br />

possamos adquirir produtos excelentes a preços acessíveis. O modelo Core 2 Duo<br />

é atualmente ,segundo avaliações feitas por instituições competentes no assunto, o<br />

mais poderoso, entretanto os da AMD é também espetacular e a um custo mais<br />

baixo, portanto a depender da finalidade destinada a segunda opção pode ser mais<br />

indicada, onde a relação custo benefício é requerida.<br />

<strong>Processadores</strong> de Duplo Núcleo da Intel<br />

Pentium 4<br />

Diante de tantos aplicativos e softwares cada vez mais exigentes, a Intel viuse<br />

em uma determinada situação em que trabalhar com processadores de núcleo<br />

único já não era mais tão eficaz quanto ela imaginava. Devido a isso, no final de<br />

2003 (Q4 período em que a Intel divide como sendo seu último trimestre), a Intel<br />

lançou o Pentium 4 baseado na arquitetura NetBurst, era um processador voltado<br />

para aplicações de alto nível e com um rendimento muito bom, trabalhava com


6<br />

instruções MMX, SSE, SSE2, e SSE3. Nessa versão de processador a Intel<br />

simulava um núcleo duplo a partir da tecnologia Hyper Treading, que visava dividir o<br />

processador em dois processadores lógicos . Contudo a Intel, não estava mais<br />

conseguindo aliar o clock, ficando com ele até algo mais de 3.8Ghz e um pipeline<br />

de 31 estágios. Além de ter havido problemas, pois acima desse clock, a eletricidade<br />

perdida pelos transistores do processador, era alta tornando assim o Pentium 4, um<br />

processador com o consumo e dissipação térmica altas demais.<br />

Pentium D<br />

No início de 2004 (Q1), surgiu o Pentium D, processador dual core para<br />

notebooks, que começou a se utilizar de 90 nm. O Pentium D, trabalha com<br />

instruções MMX, SSE, SSE2 , SSE3 e EM64T, além de se utilizar de uma tecnologia<br />

similar a usada no Pentium III, onde gerencia a energia de modo ao processador só<br />

usá-la quando necessário. E passou a se destacar dos outros processadores, devido<br />

ao fato de trabalhar com 2 MB de cache L2, tem o processamento basicamente<br />

comparado a dois Pentium 4, trabalhando simultaneamente. Os processadores Dual<br />

Core da Intel, melhoram bastante ao executar várias tarefas simultaneamente, já<br />

que os processos podem ser divididos entre os dois core, demonstrando assim um<br />

desempenho muito superior ao do Pentium 4.<br />

Core 2 Duo<br />

Em meados de 2006 (Q3), surge talvez o melhor processador do mundo, o<br />

Core 2 Duo e o Core 2 Duo Extreme, a partir desse momento o Pentium 4, se torna<br />

parte do passado. Dando lugar aos processadores com 2 ou 4 núcleos unificados<br />

trabalhando em apenas 10 ciclos contra os 14 do Pentium D.<br />

O Core 2 Duo, passa a trabalhar com as Instruções MMX, SSE, SSE2, SSE3,<br />

SSE4 e EM64T. Através de diversas técnicas de miniaturização, o Core 2 Duo,<br />

passa a trabalhar com 65 nm. Além de possuir barramentos superiores a 800 Mhz,<br />

alguns chegam até 1066 MHz o que possibilita até 4 transferências de 266 Mhz po


7<br />

ciclo). O cache L1 do Core 2 Duo ou Conroe nome genérico usado pela Intel,<br />

trabalha com 8 linhas de associação, contra apenas 2 do seu concorrente direto.<br />

Isso possibilita um cache mais eficiente, aumentando a probabilidade da informação<br />

ser encontrada. O cache L2 que pode chegar até 4 Mb, é acessado através de um<br />

barramento de dados de 256 bits. E uma das novidades mais significativas do Core<br />

2 Duo é o Macro-Fusion, que permite diversos pares de instruções comuns<br />

combinados em uma única instrução, ao invés de serem processados<br />

individualmente. Isso gera um efeito benéfico ao processador que economiza<br />

espaço nos buffers de memória, economiza processamento no agendador de<br />

instruções ou scheduler e assim por diante, causando até 11% de ganho bruto a<br />

nível de desempenho se comparado a um de seus antecessores o Pentium 4.<br />

O grande forte do Core 2 Duo está na decodificação das instruções pois,<br />

processa as instruções SSE de 128 bits em apenas um ciclo o que causa grande<br />

agilidade.<br />

Quad Core<br />

Com o lançamento da mais nova plataforma de sistema operacional da<br />

Microsoft o Windows Visa no final de 2006 (Q4 para a Intel), a Intel lançou um<br />

processador que seria o melhor para tal sistema. Assim surge no mercado o Intel<br />

Quad Core, que possui as mesmas características que o Core 2 Duo, porém possui<br />

ao invés de 2 núcleos, 4 e somente em versões com 4 Mb de cache L2, o que o<br />

torna o mais rápido do mercado ao lado do Core 2 Duo Extreme.<br />

Quad 2 Duo e tendências futuras<br />

Já em Janeiro de 2007 (Q1), a Intel fez o lançamento do Core 2 Quad com<br />

cerca de 45 nm, a nova geração de processadores dessa linha, terá um consumo de<br />

energia ainda menor, onde a Intel busca viabilizar o lançamento de versões ainda<br />

mais velozes e com maior poder de processamento. Para o final de 2007 (Q4), a


8<br />

Intel, faz uma previsão de estar trabalhando com uma técnica de miniaturização<br />

ainda melhor, vislumbrando alcançar 35 nm.<br />

AMD<br />

Athlon 64 X2<br />

A AMD foi a primeira empresa a lançar processadores de núcleo duplo com<br />

arquitetura de 64 bits, baseado na arquitetura IBM PC x86. Ela utiliza tecnologia<br />

própria para a comunicação entre o processador e os outros dispositivos de entrada<br />

e saída de memória o “Direct Connect Arquitecture” que permite conexão<br />

independente para cada núcleo.<br />

Com dois núcleos o computador trabalha como se houvesse dois<br />

processadores independentes. Apenas sistemas operacionais com suporte a SMP<br />

(Suporte ao Multiprocessamento Simétrico) são capazes de utilizar e perceber o<br />

aumento do poder de processamento proporcionado por esta arquitetura.<br />

Uma das principais características dos processadores de núcleo duplo da AMD é a<br />

comunicação entre os núcleos que se dá através de um barramento embutido no<br />

processador, chamado de HyperTransport, permitindo-o atingir velocidades maiores<br />

nesta comunicação. Outros fabricantes utilizam a ponte norte que esta fora do<br />

processador para esta comunicação, o que em teoria diminuiria a velocidade de<br />

comunicação entre os núcleos.<br />

A tecnologia de núcleo duplo do processador Athlon 64 X2 tem por base a<br />

utilização de um processador com dois núcleos, cada núcleo idêntico ao Athlon 64,<br />

ou seja, cada núcleo tem sua arquitetura baseada em um Athlon 64.<br />

Plataforma Quad FX<br />

A AMD lançou a plataforma Quad FX que utiliza dois soquetes na mesma<br />

placa mãe trazendo para o pc o que já era comum nos servidores. Através da<br />

arquitetura de Conexão Direta de Soquete Duplo (DSDC) que se dá a comunicação


9<br />

dos dois processadores de duplo núcleo, facilitando o trabalho em paralelo. O<br />

barramento HyperTransport coerente conecta os dois processadores desta<br />

plataforma. Esta plataforma exige que o processador possua dois barramentos<br />

HyperTransport, como já foi dito um conecta os dois processadores enquanto o<br />

outro barramento cuida da conexão com o chipset, vale ressaltar que há dois chip<br />

sets, um para cada soquete.<br />

Esta plataforma utiliza dois processadores Athlon 64 FX de soquete F (1.027<br />

pinos) este suporta as instruções MMX, 3Dnow!, SSE e SSE2. Alem disto nota-se<br />

também que o controle da memória é embutido no processador e a memória é<br />

acessada por um barramento exclusivo facilitando a transferência de dados entre os<br />

dois.<br />

Como podemos perceber a AMD utilizou tal recurso, pois ainda não dispõe de<br />

tecnologia para implementação de quatro núcleos em uma única pastilha, mas tendo<br />

em vista tal objetivo, esta plataforma poderá estar sendo condicionada a utilização<br />

de processadores com tal capacidade, que transporia a esta plataforma ao trabalho<br />

de oito núcleos trabalhando em paralelo.<br />

Processador sun Niagara<br />

Objetivo da empresa sun, é transformar processadores com maior<br />

performance e menos custo de energia. Utilizando uma postura agressiva multi<br />

cores, cada um capaz de executar quatro theadrs aplicando uma tecnologia CMT,<br />

também adotar arquitetura UltraSPARC que economiza recursos menos necessários<br />

compartilhando apenas uma unidade de ponto flutuantes entre todos as cores e<br />

enfatiza fatores importantes para gerar um alto throughtup,como 4 unidades de<br />

controle de memória DDR2 integrado.<br />

O processador Sun Niagara ou UltraSPARC T1,é um processador que visa<br />

atuar em servidores workload, como webservers e datacenters. Este tipo de<br />

processador possui 8 tipos de cores de processamento que (são comercializado<br />

versões de 4 a 6 cores). Onde cada um executa quatro theadrsde hardware<br />

utilizando 32 theadrs.


10<br />

A idéia do professor Kule Olukotun foi desenvolver processadores hydra CMP<br />

(Multiprocessing). Pois a empresa afara websystems não pode continuar com seu<br />

projeto por quer faltou caixa para manter, daí foi vendida em 2002 para SUM<br />

MICROSYSTEMS onde o projeto foi na base Niagara.<br />

A empresa Niagara tem objetivo de fazer processadores com altos valores de<br />

performance em quanto mantem valores de energia razoáveis. A media de consumo<br />

é 72W chegando até o pico de 79W. Tendo a sua arquitetura simples, com várias<br />

cores de baixa freqüência, mas alto throughtup é o principal fator disso.<br />

Entretanto o Niagara tem a suas limitações também, a sua limitação mais seria é o<br />

fator de possuir apenas uma unidade de ponto flutuante (FPU) apenas 8 cores, e<br />

assim é incapaz de processar mais que 1- 3% do ponto flutuantes.<br />

CMT<br />

Chipe-level multithreading é uma combinação de chip-level<br />

multiprocessing(CMT) que processa diversas cores em um chip só. A vertical<br />

multithreading (VMT) apenas umas das theadrs de cada cores para executar<br />

instruções em um ciclo, trocando para outro thead quanto a thead ativa buscar<br />

dados da memoria. Este tipo de técnica é utilizada pela sun, para minimizar a<br />

eficiência de cada cores.<br />

Todas as cores possui papiline de seis estágios, com instruções da cache L1,<br />

uma data cache L1 é uma unidade de gerenciamento de memória que são<br />

compartilhado pela 4 theadrs e todas as cores são ligada pela cache L2 , que é<br />

compartilhado por todos. assim o sistema operacional enxergar 32 processamentos<br />

virtuais.<br />

Formatos de dados<br />

A arquitetura UltraSPARC reconhece os seguintes tipos de dados inteiros,<br />

com sinal ( 8,16,32 e 64 bits),SIMD (UNIT 8 de 32bits, int 16 de 64 bits,int 32 de 64<br />

bits) e ponto flutuantes (32,64,e 128 bits). Acompanha esse tipo de dados os


11<br />

seguintes comprimentos de palavras Byte(8 bits), meia – palavra (16 bits), a palavra<br />

marcada ( valor de 30 bits e 2 bits de marcação), palavra dupla ex tendida(64bits) e<br />

palavra quádrupla (128 bits).<br />

Os inteiros com sinal são sinal completamente de dois, enquanto os inteiros sem<br />

sinal são escritos usando – se toda sua extensão. Palavra Marcada Têm a marcação<br />

de dois bits menos significativos Flutuantes tem sua representação normal (IEEE std<br />

754 - 1985), alterando apenas expoente ({7;0}, {10;0} e {14;0}) e frações<br />

({22;0},{52;32} + {31;0} e {111;96} + {95;64}<br />

+ {63;32} + {31;0}), respectivamente para 32 ,64 , 128 bits de representação, cm<br />

todas um bit sinal.<br />

Memória<br />

Com capacidade par executar theads simultaneamente, uma interface rápida de<br />

acesso a memoria é extremamente importante para Niagara. Para suprir a alta<br />

demanda de dados, o processador conta com quatro controladores de memoria<br />

DDR2 integrado. A integrar o controlador de memoria com o processador, fazemos<br />

com que ele funcione na mesma frequência do processador. Recebendo<br />

informações da memoria muito mais rápida.<br />

Cache<br />

Um dos principais limitadores a velocidade de processamento é o tempo de<br />

latência das memórias, que é o tempo despendido desde a solicitação de dados pelo<br />

processador até o recebimento dos mesmos. Para diminuir os efeitos deste<br />

problema existem os cache: memória pequena e rápida, em um nível mais próximo<br />

ao processador, que servem para armazenar os dados e instruções com maior<br />

probabilidade de serem solicitados pelo processador.<br />

Cada core do processador Sun Niagara possui um L1 de 24KB, dividido em um<br />

cache de instruções de 16 KB, com bloco de 32 B e um cache de dados de 8 KB,


12<br />

com blocos de 16B, ambos four-way set associativa, com bloco de 64B, que é<br />

compartilhado entre os 8 cores. Para manter a coerência de cache, é utilizada a<br />

técnica de write – through.<br />

Tendências evolutivas dos processadores: o que as empresas<br />

planejam<br />

O aumento de velocidade na freqüência de execuções atribuídas ao<br />

processador medida em gigahertz, esta se tornando defasada, dando lugar à<br />

multiplicação dos núcleos de processamento. Obter dois núcleos não significa ter o<br />

dobro de poder de processamento, mas permite utilizar várias tarefas ao mesmo<br />

tempo com grande desempenho. Buscar um maior poder de processamento,<br />

estabelecendo técnicas de aumento da freqüência e de números de transistores são<br />

técnicas usadas nos processadores de único núcleo. Daí surge um problema, o<br />

aquecimento do processador e o gerenciamento de energia.<br />

A Intel utilizou em seu processador Dual Core uma tecnologia que são usadas<br />

cinco portas de envio, pela qual são enviadas três microinstruções para unidade de<br />

execução por pulso de clock, uma nova tendência da Intel é o uso real de 128 bits<br />

no caminho de dados, nos processadores anteriores era de 64 bits, isto significa um<br />

maior poder de processamento para manipulação de dados de 128 bits.<br />

A AMD criou uma tecnologia chamada de HyperTranport que é uma<br />

arquitetura de conexão direta com a memória principal, tendo um controlador de<br />

memória DDR integrado facilitando o acesso rápido pelo processador. A arquitetura<br />

de 64 bits interage com qualquer software, facilitando as aplicações de 64 bits, tanto<br />

as aplicações de 32 quanto os de 64 bits são executadas de forma simultânea na<br />

mesma plataforma.<br />

O processador da AMD de duplo núcleo é diferente da arquitetura da Intel, os<br />

processadores Athlon 64 e Opteron a ponte norte do chipset esta integrada dentro<br />

do próprio processador, permitindo ao processador a troca de informações entre si<br />

de forma paralela. Na arquitetura da Intel se um dos núcleos precisa enviar dados<br />

para outro núcleo inicia-se um processo em que, ele tem que pedir permissão à


13<br />

ponte norte, que esta localizada fora do processador, tendo como conseqüência o<br />

acesso a uma velocidade menor.<br />

Recursos e benefícios<br />

A partir dos detalhes evidenciados acerca dos processadores de duplonúcleo,<br />

faz-se necessário um benchmark (comparação) entre essas CPU,<br />

destacando algumas vantagens (e desvantagens) de um processador de dois ou<br />

mais núcleos. Então, temos que o multiprocessamento é uma idéia antiga - afinal,<br />

diz um velho ditado que "duas cabeças pensam melhor do que uma" -, mas a<br />

criação de chips com múltiplos núcleos reflete a dificuldade de se aumentar ainda<br />

mais a velocidade do processador sem implementar rebuscados (e caros) artifícios<br />

para controlar o superaquecimento.<br />

Em vista disso, a Intel cancelou o lançamento do Pentium 4 de 4GHz<br />

(“Prescott”) e partiu para a linha Pentium D - e, mais adiante, para o Core2Duo. Em<br />

linhas gerais, essa solução consiste em obter mais poder de processamento sem<br />

elevar a freqüência de operação, investindo na distribuição das tarefas por dois<br />

núcleos encapsulados numa mesma pastilha de silício.<br />

Chips com dois ou mais núcleos (porque os quad-core não tardam a chegar)<br />

apresentam algumas diferenças em relação aos da tecnologia anterior, sendo a<br />

primeira delas nominal: a indicação de velocidade baseada em GHz deixa de fazer<br />

sentido, porque os dois núcleos operam geralmente na mesma velocidade - mas seu<br />

trabalho conjunto, combinado com o cache compartilhado, os torna mais eficientes<br />

(enquanto um núcleo grava um CD, por exemplo, o outro pode rodar um game, com<br />

comunicação total entre eles, ou edição de um vídeo, etc.). Isso sem mencionar que<br />

o ganho não se limita apenas ao processamento: a interação entre os núcleos<br />

consome menos energia, diminui a quantidade de calor dissipado e abre um leque<br />

de soluções para os problemas que impediam o avanço dos microprocessadores: o<br />

superaquecimento. Ao dividir tarefas com os dois núcleos, o processador produz o<br />

calor padrão do seu clock (2,16 GHz, por exemplo) sem avançar na sua curva<br />

geométrica de aquecimento.


14<br />

Tudo indica que esse tipo de CPU deverá integrar a maioria dos desktops e<br />

servidores a ser fabricado ao longo dos próximos anos. Nesse aspecto, um fator que<br />

pode ser encarado como uma desvantagem é o custo alto para o consumidor final<br />

destes produtos, que ainda estão em fase de desenvolvimento e disseminação no<br />

mercado. E como deverá se tornar padrão (tanto para Intel quanto para AMD), essa<br />

inovação acabará forçando os fabricantes a queimar seus estoques de chips<br />

convencionais, visando preparar o mercado para a popularização das novas linhas<br />

Core 2 Duo e Athlon X2.<br />

Vale lembrar que o pleno aproveitamento dos chips de múltiplos núcleos<br />

requer adequações em nível de software - a menos que os sistemas e aplicativos<br />

sejam reescritos, os benefícios não são tão representativos assim. Se por exemplo,<br />

tratarmos de um usuário que utiliza softwares “comuns” como um editor de textos,<br />

uma planilha de dados, etc., o desempenho pode não ser tão evidenciado quanto<br />

para outro usuário que trabalhe com edição de imagens ou jogos.<br />

Outros fabricantes para montagem de servidores<br />

Power6<br />

A IBM lançou o processador Power6 para ser utilizado em servidores, é um<br />

processador com 2 a 16 núcleos nas velocidades 3,50, 4,20 ou 4,70GHz. Essa<br />

freqüência de clock é mais que o dobro da do Power5, o antecessor do novo chip. É,<br />

também, mil vezes a freqüência de clock do primeiro IBM PC, lançado em 1981.<br />

Aquele PC pioneiro rodava a 4,77 MHz. Além do clock mais rápido, o Power6 tem<br />

cache interno de 8 MB, quatro vezes o do Power5. O Power6 possui um barramento<br />

de dados ultra-rápido, o processador troca dados com a placa-mãe a uma<br />

velocidade de até 300 GB/s.<br />

Um servidor System p570 construído com esse chip já bateu 25 recordes de<br />

desempenho. A empresa diz, ainda, que o novo processador, mesmo rodando a 4,7<br />

GHz, consome a mesma quantidade de energia que o Power5 a 2,2 GHz.<br />

Adicionalmente, o chip permite desacelerar o clock para poupar energia. O Power6<br />

compete com os processadores da Sun e da Intel. Os concorrentes, porém,


15<br />

concentraram-se em aumentar o número de núcleos. A Sun tem processadores<br />

UltraSPARC T1 de 8 núcleos; e a Intel deve lançar o seu Xeon de 8 núcleos no<br />

segundo semestre. A IBM, ao contrário, acelerou o clock e a transferência de dados,<br />

mas manteve apenas dois núcleos no chip.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!